渡十娘|國內大廠,為什麼集體錯過DeepSeek

做公眾號裡的《紐約客》
戳藍字一鍵關注渡十娘
轉發也是一種肯定
文字|白樹振‍‍
編輯|渡十娘 
為什麼擁有資源、人才、資料、晶片、規模、政策等等一大堆難以言說優勢的一大批網際網路大廠們,在持續幾年你追我趕的大量投入之後卻似乎只是在進行無意義的內卷
撰文丨白樹真
從最初的懷疑到形成熱潮,2025年DeepSeek的影響力,已經不輸給2023年初ChatGPT對全球產生的衝擊。
但就像ChatGPT誕生時大家開始驚訝為什麼人工智慧的創新沒有來自於IBM、谷歌、Meta之類的傳統AI強勢巨頭,今天DeepSeek的出現,也同樣引發了一個連鎖問題:
為什麼跑得又早又快、有錢又有卡的阿里、百度、騰訊、華為、字節跳動等等一眾科技大廠,甚至一度還打出“百模大戰”的氣勢,卻依然沒有孵化出類似DeepSeek這樣的顛覆式創新?
甚至有人調侃,百度風投的北京辦公室恰恰就在DeepSeek北京辦公室樓上,卻並沒有發現DeepSeek的潛力。
雖然後來百度風投對此闢謠,稱第一時間就拜訪了DeepSeek團隊,但彼時對方並不差錢,也沒有接收投資的意願。
可這樣的傳言風行本身就內涵著一個方向,那就是國內的科技大廠們,怎麼就集體錯過了DeepSeek?
01
說實話,最開始面對DeepSeek的成功,國內科技大廠們是陷入過一陣集體沉默的。
在DeepSeek爆火之前的2023、2024年,市面上已經有足夠多的大模型應用。百度的文心、阿里的通義、騰訊的元寶、華為的盤古、位元組的豆包……在技術實力上每一家都投入了大量資源。
結果,一家以炒股為主業的、百人級別的初創企業,在通用人工智慧領域卻實現了對BAT們天量投入基礎上的技術反超,實在是過於打臉。
當然,後來大廠們很快調整了思路。這幾天最熱門的新聞之一,就是從三大通訊運營商到一眾網際網路大廠紛紛宣佈接入DeepSeek,以彰顯自己對於AI技術前沿的開放擁抱態度。
圖/影片截圖
但其實瞭解技術細節就知道,接入API介面或者本地部署,事實上難度並不算大。真要說這些接入能為它們自身的AI產品帶來多大客流和技術升級,恐怕也未必。
這一舉動唯一能發生改變的,是謙遜和擁抱進步的姿態能夠幫助有效減輕外界對於其投入大量資源卻未能出現顛覆式創新的質疑,這是大公司公關手段的價值。
但真正底層的問題其實一直存在,也不是光靠公關們努力就能夠解決的。那就是為什麼擁有資源、人才、資料、晶片、規模、政策等等一大堆難以言說優勢的一大批網際網路大廠們,在持續幾年你追我趕的大量投入之後,卻似乎只是在進行無意義的“內卷”?
02
除了百度文小言(原文心一言)之外,一定程度上最可惜的或許是阿里的通義千問。作為雲計算時代長期位居全球前四名的實力型選手,無論是從算力還是人才角度,阿里雲在孵化通義千問時應當是有巨大的先發優勢的。
但現實是,通義千問在公眾認知度方向上的掉隊速度,與百度的文小言也相差無幾。如果搜尋通義過去兩年來的新聞會發現,這款大模型在技術上的投入並不算差,甚至可以算得上是領先狀態。
早在2023年8月,阿里雲就宣佈全面開源通義千問70億引數模型(Qwen-7B),隨後陸續開放140億、720億引數版本,形成國內首個完整開源的大模型家族。在應用端上,AI開發平臺“魔搭”更是能支援開發者以低程式碼方式呼叫通義千問能力,甚至形成亞洲最大AI模型社群。

▲2023阿里雲峰會(圖/影片截圖)

但很多人可能都有體會,在To C應用端,對於通義千問幾乎沒有什麼感知,甚至很多人根本想不起來這款大模型產品。其影響力還不如月之暗面的Kimi助手來的認知度高。
通義千問也不怎麼公佈自己的日活數量,這可能和產品宣傳力度的投入有關係,但本質上還是因為產品的標籤一直比較模糊,沒有形成一個足夠強大的使用者心智。以至於近日當蘋果把中國AI合作伙伴定為阿里巴巴時,很多人都有點意外:為什麼會是阿里?
當然,類似的問題其實不止是阿里,同樣體現在騰訊混元身上。本身騰訊跟進AI就相對國內大廠晚了一段時間,且在應用層,並沒有讓使用者瞭解到混元大模型和其他大模型產品的差異到底是哪些。
它更像是一個典型的騰訊系產品——別人有的,我們也要有,至於未來怎麼樣,看看哪個模式能跑出來再說,這樣風險最低,效率最高。
一直以來,騰訊更加擅長的是微信這樣的應用創新而非DeepSeek這樣的顛覆式創新,騰訊內部的賽馬機制本質也是這個邏輯,先試試看,等成功路徑被基本驗證之後,再進行最佳化和推廣。
此外,不得不提到的還有前陣子風頭正勁的豆包,當字節跳動投入了大量時間和精力、資源到這款產品上,乃至於眼看就要取得AI應用市場佔有率第一的最後勝利時,結果DeepSeek橫空出世,以領先的顛覆式技術創新,一舉打敗了以往豆包在使用者體驗上的精心修補。
所有人都跑去下載DeepSeek了,國內一眾大廠打了半天,結果一夜回到解放前。
03
如果非要給國內大廠為什麼錯過DeepSeek總結一個規律的話,那麼可能是因為真正的顛覆式創新,天然就是厭惡組織化、目標化的。
正如熊彼特所言,創新首先就是“創造性的破壞”,它意味著不確定性和巨大的風險。而這一點,與體系化的、組織化的機構目標其實是截然相反的——無論是政府投資還是大型企業組織,天然都是追逐效率而厭惡風險的。
這因此也形成了一個悖論,在數學領域,這被稱為哥德爾陷阱,成功的系統往往會衍生出限制其今後的內在規則。而在管理學領域,它被稱為“大公司病”。
這種情況,其實在ChatGPT誕生時,在美國就被反思過一遍了。為什麼美股一眾科技巨頭都沒有做出ChatGPT?當時最直接的原因是由於彼時依靠堆疊算力的路線並不被看好,因為矽谷大廠們普遍認為這是低效率的路線。
今天的DeepSeek故事是一樣的:DeepSeek的混合專家模型(MoE)路線,在過去兩年同樣並不被各個大廠看好。
但也正如李彥宏所說,創新往往就是這樣無法預測的。
圖/影片截圖
而且,曾經率先做出創新的OpenAI其實就已經開始逐漸陷入到這種“大公司困境”之中。回過頭看OpenAI這兩年的變化,從閉源路線的選擇到2024年中主動限制IP為中國地區的API介面,一度逼得中國開發者們轉回國內大模型平臺。難怪很多人諷刺,OpenAI正在變得越來越不Open了。
OpenAI的落後,恐怕也是這幾天馬斯克開始提出動議收購這家公司的原因。經歷了此前的政變和宮鬥之後,獲勝者山姆·奧特曼顯然並沒有做到讓OpenAI持續領先。
從這個角度來看,當梁文鋒已開始可以登上富豪榜單,DeepSeek未來如何繼續保持過去的這種創新能力,恐怕才是最大的挑戰。
做最好的公號  做更好的自己
電影節專題
昨日更新:
熱文連結:
    2024熱文排行榜:
移民主題:
十夜譚主題:
美國大選主題:
其他:
讀完請點"在看"讓更多人看到
圖片 I 網路
整理 I 編輯 I 渡十娘
清單內容來自 I 程明
版權歸原作者 I 如有侵權 I 請聯絡刪除
生活中
總有些東西值得分享
·十·娘
DES
IGN
發現 I 家庭 I 樂趣
想每天與渡十孃親密接觸嗎?
喜歡?粉她!
有話想說:

相關文章