為什麼是梁文鋒做出了DeepSeek?

一個更清晰的梁文鋒,一個更明白的關於DeepSeek的故事。
作者丨高允毅
編輯丨馬曉寧
這是2025年開年最火的科技明星,短短幾天時間,梁文鋒從小到大的種種過往都被展現在世人眼前,包括他來不及裝修的新房以及在房子裡睡覺用的帳篷,都成為了他獨特個性的象徵。
獨特個性固然為人津津樂道,但並不是成功的關鍵,這個籍籍無名的大學生,在過去的十幾年中所能倚靠的,只有他的思想和能力。
所有人都好奇這樣一個問題,為什麼是梁文鋒做出了DeepSeek?這其中固然有時代的因素,以及他本人迥異於其他大模型研究者的個人經歷。但AI科技評論認為,理解梁文鋒是個什麼樣的人,才是理解這個問題的關鍵。
1
找人才不需要標籤
獵頭都覺得,幫梁文鋒的公司找人太不容易了。
一位從21年開始就與幻方深度合作的獵頭告訴我們,招人招得讓他“想哭”,因為難度太高了。
“清華本博,六篇頂會,你覺得肯定沒問題了吧,哎,怎麼簡歷直接掛了;一個清華本科的MIT博士,第二輪面試就被淘汰了。”
如果要在大廠內部找候選人,他認為,幻方和DeepSeek基本上不會對標國內公司,他們只會對標Google和Meta這樣的海外大廠。
另外一位獵頭一談到DeepSeek也是忍不住頭大,“太挑剔了,推過一個在位元組績效非常好的年輕中層,聊了之後沒過。我就很奇怪,去問他們,給我的回答是,這個人對AI沒有熱情。人家都是做過一些AI Agent相關的專案了,一般是不太會說這樣的評價的。”
梁文鋒對人才沒有標籤,不論學歷背景,不論過往業績,他只看這個人的個人能力和個人素質。
極高的人才門檻,造就瞭如今的DeepSeek。在國內的大模型團隊中,DeepSeek的人才厚度可能不足以跟頂尖公司相提並論,但是人才密度絕對可以說得上是第一檔。
留住這些人才,除了DeepSeek的高薪酬外,還有充分尊重創意與idea的管理模式。“無固定團隊、無彙報關係、無年度計劃”與其說是管理,不如說是信任。《奈飛文化手冊》一書曾經說過,“優秀的同事和艱鉅的挑戰是吸引人們來公司工作的最大因素”。對AI從業者而言,再沒有比AGI更艱鉅的挑戰了。
做最難的事,就要找到最好的人,給出充足的資源與信任。得到信任的頂級人才往往會帶來巨大的爆發力,這一理論可以在抖音崛起中得到印證。
在2018年春節期間,抖音日新增使用者超過千萬量級。一位負責增長的產品經理曾提及,這個增長專案完全沒有績效壓力,而且向財務發了一封郵件,他的賬戶中就多出了上億元的投放預算。他當時就意識到,“這樣的團隊,做啥打不贏呢?”
DeepSeek也是同理。被篩掉簡歷的人,一定不是學歷問題;面試通不過,肯定也不是能力問題;人才的需求集中為一句話就是,這個人是可以被信任一同為AGI努力的人嗎?
這就是DeepSeek的人才觀,理解了這種人才觀,就是理解梁文鋒的第一步。
2
極簡主義的價值觀
儘管做了多年量化,但是梁文鋒並不認為自己是個做金融的,他對自己的看法是,“我是做AI的,只不過做的是量化場景”。
幾乎所有與梁文鋒交流過的人,都說出他是一個不會受到外界干擾的人,“他的思維方式極其純粹,特別注重第一性原理”,“說話很慢”,“一開口就切中要害”。
量化投資的特性恰好契合了他這種極簡主義的風格——它不需要與複雜的上下游產業鏈打交道,只需專注於純粹的市場資料。
時至今日,梁文鋒依然常常沉浸在自己的技術世界中,專注於解決問題。比如做大模型這件事,他會告訴別人,“想清楚了就能幹,只要有卡就行”,其他困難不在考慮範圍之內。
對待金錢也是如此。錢就是用來投資,或者做慈善事業的,只要能花在合適的地方,虧損並不值一提。
2023年底,曾有一個旨在扶助聾啞人士的手語大模型專案,為了拉投資找到了梁文鋒。梁文鋒提出,這個專案的優點是公益性突出,缺點是市場規模有限,其中的隱患是,這是一個Top高校大學生團隊的專案,他們可能不會長期堅持。
儘管極有可能得不到任何回報,他仍然提出,只要團隊願意繼續推進專案,他就願意投入。
過去梁文鋒每年會拿出5億元用於投資或慈善上,現在他把這筆錢花在了DeepSeek上。炒股是為了掙錢,投入大模型是為了AGI,僅此而已。
DeepSeek有將近兩萬張卡,他對算力極其慷慨,對上述的手語大模型團隊,他就承諾過,算力叢集會隨時向他們開放。但是他又有點“小氣”,對這近兩萬張卡的利用率要求很高,力求打滿,不要空轉。
這兩種行為看似矛盾,如果按照極簡主義的觀點來解釋,那就行得通了:卡的存在就是為了用的,能用盡用,萬勿浪費。
3
不以商業化為限
沒花一分錢投放費用,DeepSeek的App只用7天時間就得到了一個億使用者,對這一奇蹟般的增長,梁文鋒怎麼看?
有投資人在春節期間專門問了梁文鋒這個問題,但是梁文鋒看起來對這麼大的流量根本毫不在意,投資人得到的回答是,“這距離AGI的路還很遠”。
這並不是梁文鋒在故作姿態。據AI科技評論瞭解,DeepSeek只安排了兩三個人負責App維護、對話網頁開發、以及充值後臺的管理工作。所以它不好用是正常的。
DeepSeek在B端市場的種種事蹟,流傳更廣。比如此前他們的私有化部署定價僅為45萬元,其中不僅包含一臺H20或910b的使用權,還附贈大模型服務,使用期限為一年。而同樣的價格,在華為雲上僅僅只能租到 910b一年的使用權,這也就意味著 DeepSeek 的大模型近乎免費提供。
私有化部署不掙錢,DeepSeek也不在乎靠API掙不掙錢。一位對接DeepSeek的大廠員工吐槽它有一種“愛用不用”的氣質,總是很難用,總是不調整。
再大的客戶和呼叫量,都不值得另眼相看。一切大廠在高峰期都要排隊,使用者體驗很差。大客戶的反饋也很多,要求DeepSeek擴容擴容再擴容,至少回應流暢一些,不要兩次請求就有一次失敗,這種失敗幾乎不能忍受。
外界喧喧囂囂,不過樑文鋒看起來並不是很在意這件事情。
這種情況應該如何解決?不少公司為此苦惱。根據一些內部流傳出來的說法,梁文鋒認為,大廠完全有能力自己想辦法解決請求失敗的問題,他們應該自己給自己兜底,而不是過度依賴 DeepSeek來保障服務。
這個回答簡直要把人給氣笑了。
可以說,現在的梁文鋒不在乎商業化的一切可能。
在不少團隊投入到應用的今天,梁文鋒曾經跟一個好友說過,“你不要一直去看應用和行業落地的事情,你現在去看只能把你自己禁錮住了,因為沒有到時候,現在想的一切都是錯的。而且你在錯誤的路上你還投入了更多時間、精力和錢。”
這是對好友的忠告,也是自己的踐行。將精力投入到應用上,投入到商業化上,對梁文鋒來說,不論做什麼,都是一條錯誤的道路。
而正確的道路從來只有一條,他現在已經走在了正確的道路上。
更多內容,點選下方關注:

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!
公眾號轉載請先在「AI科技評論」後臺留言取得授權,轉載時需標註來源並插入本公眾號名片。

//
近期熱門文章

相關文章