一個撼動全球的中國人!

作者丨燕大

1月20日,DeepSeek老闆梁文峰進京開會。
當天晚上,DeepSeek(深度求索)的推理模型 DeepSeek-R1 釋出,開源、免費、可驗證,因為他將技術報告也一同開源了。
沒人想得到,僅過4個工作日,這一家不起眼的小公司,竟掀翻了美國科技巨頭,一舉將中國大模型硬生生拉到世界領先水平。
牆內開花牆外香,緩慢發酵數天後,首先被點“爆”的是大洋彼岸的科技界,接著這兩天“DeepSeek”(深度探索)這個英文在各大平臺衝上熱搜、頻繁刷屏。
就是這家來自中國的、名不見經傳的小公司,卻在美東時間週一,讓美股震動,出現少有的暴跌,尤其是晶片、AI科技股。
標普500指數跌了1.46%,納斯達克指數暴跌3.07%,科技巨頭方面,谷歌大跌4.03%,微軟下跌2,14%,最最意外的是,全球AI晶片的王者——英偉達,在昨晚暴跌近17%,差點跌了近1/5!市值蒸發約6000億美元,約合4.27萬億人民幣!
外媒說這是史上最大的一次暴跌,心態都快跌崩了。
說出來你可能都不敢相信,這家來自中國的小公司——DeepSeek,背景是一家炒股的量化公司,名叫幻方量化,炒股的應該都聽過。
同樣是炒股,量化私募公司不像幹金融的,更像搞科研的,從創始人到員工,不少都是學計算機和數學的,崗位包括資料科學家、AI演算法研究員、AI架構工程師等,你還在用個人經驗炒股的時候,量化公司的決策早就依靠大資料和AI人工智慧。
就好比幾十年前贏了國際象棋大師的計算機,收割對手的不是另一個象棋高手,而是來自另一個領域的降維打擊。
這幾年在股市裡,能賺到錢賺到打錢的,可能也就是量化私募公司了,跟玩個人經驗的完全不是一個級別。
說到這裡,我都有種感覺,咱們的大A貌似都成了它訓練超級大腦的超級“訓練基地”。
DeepSeek公司,是梁文峰在幻方量化私募之外,於2023年5月搞的一個“副業”,單獨研究AI大模型技術,沒有西方資本風投,員工也多來自國內高校剛畢業的大學生或AI 職業生涯剛起步的開發人員。
為什麼不挖更有經驗的人?梁說話一段話,“如果追求短期目標,找現成有經驗的人是對的,但如果看長遠,經驗就沒那麼重要,基礎能力、創造性、熱愛等,更重要。”
但沒想到,這個並不老練的團隊,僅用一年多時間,就推出了模仿人類思維的DeepSeek-R1,在數學、程式設計自然語言推理等任務上,效能比肩當前“地球最強大腦”——OpenAI o1。
外國選手已經驗證,對比很直觀:
案例1,“編寫一個 Python 指令碼,讓黃色小球在正方形內彈跳,確保正確處理碰撞檢測。讓正方形緩慢旋轉。用 Python 實現。確保小球停留在正方形內”。
左邊是OpenAI o1,右邊是DeepSeek R1:
案例2,“要求實現一個帶有紅球的旋轉三角形。”
左邊是OpenAI o1,右邊是DeepSeek R1:
這兩個對比非常直觀,DeepSeek-R1在數學、程式設計等複雜推理的效能,與OpenAI o1旗鼓相當甚至超越。
對咱們普通老百姓來說,輔導孩子做數學作業、程式設計作業甚至奧數都不用燒腦了,用這個app再簡單不過。
在語言領域的效能,有從業者舉了個更通俗的比喻,用ChatGPT寫套路性很強的應用文很好用;
但一旦涉及到高語境、調侃、諷刺之類,就有濃厚的AI味,沒有幽默感,但DeepSeek對高於境內容和中文網路上的梗都能理解明白,內容可以達到脫口秀水平。
這大概也是這兩天DeepSeek的下載被擠爆的原因,註冊都緩慢了不少。不但在效能上跟世界頂尖水平比肩,在成本上,DeepSeek的訓練成本還足夠低!
根據公佈的技術文件,DeepSeek-V3模型的訓練成本只有557.3萬美元,使用的還是“閹割版”的英偉達H800 GPU叢集。
而同樣是開源模型的Meta旗下某一模型的訓練成本就超過6000萬美元,OpenAI-4o的訓練成本為1億美元,且用的是效能更爆棚的英偉達H100 GPU叢集。
換句話說,即使哪天DeepSeek模型要收費了,估計也是白菜價。兩相對比,更差的裝備、更低的成本,卻幹掉了裝備精良武裝到牙齒的王者,這你找誰說理去!
上架10天不到,用實力擊敗ChatGPT,登頂蘋果應用商店排行榜。以極低的成本構建出了一個突破性的人工智慧模型,DeepSeek橫空出世,甚至導致一個籌集了10億美元的前沿實驗室,因為產品比不過DeepSeek,連發布都不敢釋出了。
到現在很多人也有點難以置信,中國一個不起眼的小公司,進京開了個座談會後,釋出的AI模型,竟然比肩甚至超越美國“最強大腦”OpenAI o1,真的匪夷所思。
但現實又再真實不過!DeepSeek的橫空出世,直接打破西方前沿科技只可追趕無法超越的神話。
其實,關注時政的人應該能察覺,1月20日,新聞聯播報道DeepSeek創始人梁文峰獲邀參加高層座談會,就是個重大訊號。
首先,肯定是這個小公司在AI領域有了特別重大突破;其次,就是這個突破在世界上都屬於領先。
要知道,這些年國家為了應對西方科技封鎖,解決卡脖子問題,拉近中美之間硬科技的距離,急迫性,人所共知,要政策給政策、要錢給錢,普遍撒網,為的就是有朝一日有人能夠取得突破性進展。
在硬科技、前沿賽道上,國家高度關注,要不然也不會出現DeepSeek創始人在最新模型釋出前進京開會那一幕。
DeepSeek的橫空出世,讓美國科技圈睡不著覺,同樣也讓很多國人睡不著覺。
無他,實在是衝擊太大了,對國人來講,美國從0到1、中國從1到100是腦子裡的固定模式,突然出現中國AI技術比肩甚至超越世界頂尖,非常不可思議。
其實,中美網民小紅書對賬,讓很多國人對歐美文化、生活環境祛魅,而DeepSeek再一次證明,哪怕是前沿科技,也應該對西方祛魅。
任正非說過,從國外引進來的高新技術,開啟後發現竟是中國雞下的蛋。中國從來不缺人才,也不缺天才,缺的是敢想象,敢獨立自主走自己的路。
不起眼的小公司DeepSeek,靠效能較差的硬體和並不老練的團隊,掀翻英偉達,有人說,這是以少勝多、以弱勝強。
但我認為,這些都是表象,本質上都是國運加持罷了。

– End – 
   位卑未敢忘憂國!
@關注和轉發,就是最大的支援@
對話作者請新增微信:
ydx20212022

相關文章