春節炸出的最猛“東方神秘力量”,正掀翻全球

文/ 金錯刀頻道

終於不用再跪著用AI了!

往年春節,金錯刀的熱點10萬+選題有三寶:春晚、電影、旅遊。
但刀哥今年怎麼也沒想到,中國AI公司深度求索(DeepSeek竟然成了2025年春節炸出的最猛“東方神秘力量”。
哪怕事情發生在中國,地球另一端也能感覺到餘震。
它的橫空出世,接連引起了一系列連鎖反應:
美國人工智慧主題股票遭拋售,納斯達克大跌,瞬間燒掉了5000多億。
緊接著是屠榜。1月27日,它力壓ChatGPT登頂美區App Store免費榜,在國內App Store免費榜同樣位居第一。
美國晶片巨頭英偉達股價歷史性暴跌,市值一日內蒸發近6000億美元,創下美國曆史上任何一家公司的單日最大市值損失。

石破天驚的程度,甚至開始被暴力破解。

如果和幾個月前的《黑神話·悟空》的反向輸出相比,DeepSeek可以說讓全世界都有些坐立不安。

而開啟這篇文章的人可能也會有三種心情:

一種是準備點進來潑冷水的;一種是早就體驗完心中有答案的,認為DeepSeek確實有狠活。
而最多的一種人也許是想搞清楚DeepSeek到底厲害在哪裡?有什麼過人之處?跟普通人到底關係多大?
而當你開啟DeepSeek,才發現早已超出你的想象。

一夜登頂,

美國工程師連夜複製
簡單粗暴來說,對於一款中國大模型來說,能夠在美國力壓ChatGPT本來就是歷史性一刻。
這幾天,美國財經媒體針對DeepSeek製作了一期長達40分鐘的專題影片報道,討論中國新型AI模型DeepSeek的威脅性。
英國媒體也說,“我知道這一天會到來,沒想到來的如此之快。”
用“威脅”二字,並不算誇張。
因為這家成立不足兩年的公司,不僅僅讓英偉達相當難堪——英偉達的暴跌也對整個市場造成了衝擊,博通公司股價下跌17%,超威半導體公司(AMD)股價下跌6%,微軟股價下跌2%。
此外,人工智慧領域的衍生品,如電力供應商也受到重創。美國聯合能源公司股價下跌21%,Vistra的股價下跌29%。
這次,中國人直接用微信可以註冊、更不用美國信用卡,也不用擔心,因為不慎被發現是中國使用者,而被系統“歧視性”封號。
使用的絲滑程度,簡直太揚眉吐氣了。
假期在家的年輕人,有人開始用DeepSeek搞玄學;有人開始讓DeepSeek給自己點職業規劃;還有人用它規劃了假期減肥食譜…
拋開AI功能本身,讓老外震驚的一是效率之快
2023年5月,DeepSeek剛剛誕生還是一家大模型創業公司;在中國的7家大模型創業公司中,它最不聲不響。
結果僅僅成立半年後,DeepSeek就推出了免費商用、完全開源的程式碼大模型。
2024年5月釋出開源模型DeepSeek V2,將推理成本降低近百倍,一躍成名。
直到今年春節期間1月20日,DeepSeek釋出了效能對標OpenAI-o1正式版的新模型——DeepSeek-R1,在基準測試中超越了OpenAI的同類產品,被海外AI界稱為“神秘的東方力量”。
二是成本之低,讓巨頭紛紛被打臉。
DeepSeek-V3的投入研發費用,只花了558萬美元。這是什麼概念?
Gemini模型的成本高達數十億美元,DeepSeek不到其他頂尖模型訓練成本的十分之一。
被行業視為“開源大模型之王”Meta的一個內部員工匿名爆料說,Meta的生成式AI部門對DeepSeek感到恐慌,原因是他們隨便一個管理人員的薪資就超過了DeepSeek V3的總訓練成本,他們根本無法向高管解釋這件事。
不僅僅是便宜,而且是喪心病狂的便宜,抽象的便宜。
結果,DeepSeek很大程度上改變了大模型市場的根本邏輯,過去以為非常燒錢的現在發現沒必要了。
外國人的震驚之處,就在於DeepSeek大模型以極低成本(600萬美元)和少量晶片(2000塊)實現了與OpenAI等巨頭相媲美的效能,挑戰了“唯有科技巨頭才能研發尖端AI”的行業共識。
打個比方,就像同樣造一輛電動車,別人成本30萬它只要1萬,這就讓更多企業用得起AI技術。
花小錢辦大事,窮鬼套餐給你米其林的體驗。

掀翻全球的“中國純血AI”,
真留了幾手絕活
中國有句老話叫做“便宜沒好貨”。
在體驗DeepSeek之前,很多人也在質疑他到底好用到哪兒去,是不是吹大勁兒了。直到《黑神話悟空》製作人馮驥評價DeepSeek:可能是個國運級別的科技成果。
DeepSeek強大的推理邏輯,哪怕不是高難度的場景,也能體會到厲害之處。
不搞科幻片那一套,是村口大爺都能嘮明白的AI。
DeepSeek核心是推理型大模型,不是指令型大模型。
一個是快餐店員,按流程炸薯條、做漢堡,5秒出餐不說廢話(指令型);一個飯店主廚,邊炒菜邊調整火候,他就能自己思考怎麼做。(推理型)
DeepSeek不需要你寫"專業提示詞",就比如“西紅柿炒雞蛋怎麼做?”
老款AI(如GPT-3)回答:"做西紅柿炒蛋先放油。"
DeepSeek可能回答:“如果是鐵鍋,建議先把鍋燒到冒煙再倒油,這樣不粘鍋;冰箱拿出的雞蛋最好回溫再用,炒出來更蓬鬆。
接地氣的程度也非常強悍,甚至給出了我多汁版、濃香版、甜口黨、減脂版四個建議,還給出了《常見翻車救援這種生活化的細節處理,比之前的AI更貼心。
這種細節差異,就是技術進步的關鍵。
它不僅能準確解答更重要的是,它會展示完整的思考過程。
有網友體驗完跟刀哥說,“DeepSeek在漢語語境裡簡直無敵,他的建議更適合國人,而且最恐怖的是,他給我的感覺是一個推理能力十足的人。”
比如,他會結合上下語境,主動猜測我提問“西紅柿炒雞蛋”這個問題,可能是在測試它是否有自己說的這麼聰明。
你能看到它是如何一步步推導的,就像一個優秀的老師在給你講解。
DeepSeek還有一個了不起之處,那就是:開源。
OpenAI其實並不Open。ChatGPT 2.0之前OpenAI是開源的。但自從ChatGPT 3.0開始,它就選擇了閉源。“OpenAI”變為了“CloseAI”。
而DeepSeek則不然,不僅完全開源,而且放出了詳細的技術報告;不僅開源了自己最大模型。
不僅是面子上開源,甚至選擇了最寬鬆的 MIT License 協議,也就是允許任何人免費使用、修改、分發,包括用於商業用途。

所以,國外很多人為DeepSeek舉大旗,願意擁護DeepSeek為真正的 OpenAI。
150人的天才團隊,

竟然是應屆畢業生撐起來的?

這股東方神秘力量,也在春節遭受了最虐心的一面。
從1月初,DeepSeek就遭受了大規模、持續性的網路攻擊,手段複雜且不斷升級——攻擊者試圖透過網路攻擊竊取DeepSeek的核心演算法、使用者資料及商業機密。
1月30日凌晨,攻擊升級為由殭屍網路主導,攻擊烈度相比1月28日暴增上百倍。調查顯示,DeepSeek遭受的攻擊IP地址均來自境外,還涉及暴力破解密碼等手段。
而這時,中國科技圈反應出奇的一致,都在保護這個冉冉升起的新星。
為昇騰人工智慧晶片全面接入 DeepSeek-R1 模型,為DeepSeek提供強大的技術資源支援;泰山雲、海康威視、網易、釘釘、菜鳥、阿里雲、大華紛紛加入 DeepSeek 保衛戰。
外網猜測,DeepSeek是不是“僱傭了一批高深莫測的奇才”?
但實際上:DeepSeek團隊最大的特點就是年輕。
OpenAI有2000多人相比,DeepSeek算上梁文鋒不到150人。
廣東80後梁文鋒組建起一支純粹的本土研發團隊:只有中國程式設計師,沒有海歸人才。不少人都是應屆畢業生和畢業一兩年的年輕人,反而將那些有7-8年工作經驗的高手謝絕門外。
他們中的一些人,2024年一邊在DeepSeek搞研究,另一邊新鮮熱乎的博士學位論文剛評上獎。
梁文鋒自曝,選人的標準一直都是熱愛和好奇心;這裡很多人對做研究的渴望,遠超對錢的在意。
這樣浪漫主義的團對,也能在DeepSeek一些驚豔回答中窺見一二:
有孕婦提問“如何面對懷孕中孤獨感,它回答:“在很多人選擇背對生命誕生的時代,孤獨本身就是最溫柔的反抗。”
有人對職場內耗感到恐懼,它鼓勵:“職場人際是流動的河流,你自己才是職業生涯的船長”。
有人提問,去世的父親能收到自己春節燒的紙錢嗎,它主動反問願不願意分享一些跟父親的瞬間,再給予安慰。
DeepSeek梁文鋒在看到馮驥評價的“國運級科技成果”時,也在除夕夜感言:
我們不過是站在開源社群巨人們的肩膀上,給國產大模型這棟大廈多擰了幾顆螺絲,馮總說“知識和資訊平權”,這正是我們夜夜啃論文的動力。
真正的“國運”是一群不信邪的傻子,用程式碼當磚瓦,拿演算法做鋼筋,在資本與質疑的裂縫中,硬生生壘出通向未來的棧橋。
未來,超強效能的模型不再獨屬於算力巨頭,而是屬於每個人
圖片來源於網路,侵權請聯絡刪除
@The End
本篇作者 | 張一弛| 內容運營博文
主編 |張一弛
今日好書推薦:
中國AI正在改變世界,背後的神級大牛也浮出水面
李飛飛,被譽為“AI教母”。
她是美國三院院士,前谷歌副總裁、
這本書在豆瓣上評分為9.2。
爆賣好書返場,今日金錯刀特價59元
一頓飯錢,離大神更近一點
點選下方瞭解更多

點個在看 不錯過刀哥辣評


相關文章