李開復:超大模型預訓練逐漸寡頭化,國內將收斂至DeepSeek、阿里、位元組三家

整理 | 褚杏娟
3 月 20 日,零一萬物 CEO、創新工場董事長李開復博士接受了彭博社的專訪。
在訪談中他表示,DeepSeek 爆紅出圈給整個中國大模型行業完成了實質意義上的市場認知教育,隨著模型效能的提升與推理成本的下降,2025 年 AI-First B 端、C 端應用都將迎來爆發。另一方面,各地政府也對大模型展現出濃厚的興趣,都在積極探索如何將 AI 應用到當地優勢傳統產業中,用產業大模型打造“新質生產力”,進而促進實體經濟的增長。
李開復博士以 Windows 核心類比:DeepSeek 是 Windows 核心,而零一萬物提供的平臺則是 Windows 作業系統、應用程式、UI 介面。沒有 Windows 作業系統、應用程式、UI 介面,Windows 核心就無法發揮真正的價值。要真正發揮大模型的價值所在,AI 領域內仍然沒有出現自己的“ Windows 作業系統”,零一萬物想要做的正是填補這一空缺。
談及大模型領域未來的競爭格局,李開復博士認為,在中美兩國超大模型的預訓練都在逐漸寡頭化,並且寡頭化的程度在不斷加大。他預測中國大模型領域未來將會收斂至 DeepSeek、阿里巴巴、字節跳動三家, 其中以 DeepSeek 勢頭最猛;美國則以 xAI 的發展勢頭最為迅速,但 OpenAI、Anthropic、Google 也都會做出令人敬佩的研發工作。
至於中美之間的 AI 競賽,李開復博士認為在印證了“需求是創新之母”的同時,DeepSeek 的突破也使得開源模式呈現出壓倒性的優勢,堅持閉源策略的 OpenAI、Anthropic 等公司,都會面臨更大的壓力。
今年零一萬物做的最大的調整是:不再執著於只推 Yi 模型,採取“開放模型”的策略。此前,零一萬物 COO  Anita(黃蕙雯)明確表示不會再做萬億以上超大引數模型,“因為我們做不起。”零一現階段最關注的是能否真正把 AI 推到市場上,讓市場不只歌頌 AI,而是真正能用上 AI。
李開復分析,零一做 ToB 產品的優勢在於積澱。零一有完整的軟硬結合的解決方案,在如何微調、如何對應資料庫、如何做機器訓練和資料配比上的經驗豐富。下面為李開復博士對話全文。
填補 AI 圈還不存在的 Windows
彭博社:今年可謂是人工智慧真正滲透各行業的元年,此次我們特邀零一萬物 CEO、創新工場董事長李開復博士來深入探討這一話題。今天也是一個絕佳的時機來和您一起討論,因為零一萬物剛剛對外發布了“萬智企業大模型一站式平臺”,首發能幫助企業更廣泛地部署、應用 DeepSeek 模型的解決方案。能不能請您詳細介紹一下這項業務?
李開復: 當 DeepSeek 問世的時候,中國迎來了自己的“ChatGPT 時刻”,我們可以稱之為“DeepSeek 時刻”。在中國春節假期期間,幾乎每個人都在談論 DeepSeek,許多企業的 CEO 們節後返工馬上要求在自己的公司裡用上 DeepSeek。他們發現,DeepSeek 是一個非常出色的模型, AI 的表現令人驚歎,但它不能直接賦能公司裡面的人力資源、財務和客服等場景,因為開源模型還缺少連線企業資料庫、應用程式等必要的中介軟體。
零一萬物認同 DeepSeek 所取得的巨大進步,我們決定全力支援 DeepSeek ,讓它更好用。我們補充了那些缺失的中介軟體,開發了易用的使用介面,使 DeepSeek 在企業中變得可用。這就是零一萬物於本週一釋出的產品——萬智企業大模型一站式平臺,它在中國大陸和香港地區的初期反響相當不錯。
彭博社:這款“萬智”新平臺背後的考量是怎樣的?
李開復: 許多人現在都下載了 DeepSeek,也很喜歡使用 DeepSeek。我有一個 CEO 朋友問他的員工:你們都用 DeepSeek 做什麼,得到的答案是算命。這是很有意思的用法,你們或許都可以試一試,但目前的 DeepSeek 還無法直接深入到企業級應用裡去。
每個企業都有 ERP 和 CRM 資料庫,有員工資料等各種分門別類的企業內部資訊,企業需要的是具備行業縱深的知識型模型。比如彭博社會希望有一個金融知識淵博的模型,平安保險集團會希望有一個保險專業知識的模型。零一萬物釋出的平臺,就是為了滿足這類各行各業的企業級需求。
這就像是如果我交給你 Windows 核心,你可能不知道如何把它用起來,你會需要 Windows 軟體作業系統和應用程式介面,還有配套的 Windows 系列應用,Windows 核心才能變得有用。零一萬物推出新的萬智企業大模型一站式平臺,就像是在為 Windows 核心構建視覺化介面和操作中臺,讓 DeepSeek 的基座模型高效便捷地轉化為有效的生產力工具。
“超大模型的預訓練正在逐漸寡頭化”
彭博社:選擇 DeepSeek 作為底層架構而非美國模型,是否折射出中美 AI 競賽格局變化?
李開復:在中美,超大模型的預訓練正在逐漸寡頭化,並且寡頭化的程度在不斷加大。雖然未必所有人都認同,但我們的確同時看到開源圈展現出壓倒性的優勢,OpenAI 和 Anthropic 都相信自己還能訓練出遠超其他玩家的閉源模型。當他們看到一個性能相近的開源模型時,我想他們可能受到了沉重的打擊。OpenAI 在 2024 年的運營成本為 70 億美元,而 DeepSeek 的運營成本可能只有 OpenAI 的 2%。
各家的模型都很優秀,問題不在於哪家模型效能高出 1%,而是 OpenAI 成本高昂的模型路線是否具有可持續性。OpenAI 每年花費 70 億美元,面臨著鉅額虧損。但現在出現了一個競爭對手,將成本低廉數倍的開源模型免費開放給市場,且這個競爭對手資源充沛,目前看來 DeepSeek 有足夠的資金儲備持續投入模型研發,並已經有效地將計算成本降低了五到十倍。有了這樣一個強大的競爭對手,我認為 OpenAI 的薩姆·奧爾特曼可能夜裡輾轉難眠。
彭博社:那麼,你認為 DeepSeek 真的挑戰了現有 AI 的商業邏輯嗎?另外,無論是在美國還是在中國,AI 的商業落地已經相當規模化。在開源模式佔據優勢的當下來看,你認為中國市場未來會跑出多少個 AI 大模型?
李開復: 我認為很大機率會收攏到三家,DeepSeek、阿里巴巴和字節跳動。他們的模型會隨著時間不斷迭代進化。
彭博社:這份名單上少了一些公司的名字。
李開復: 當然,還會有許多其他公司希望構建他們自己的模型,我們也會拭目以待看是否會有第四、第五個玩家。但即使在這三個中,我看好 DeepSeek 目前最具勢頭,這也是我們基於它推出新產品的原因。
但我也想指出,關於你問到 AI 模型商品化的問題,我不認為今天的 AI 已經商品化了。我認為,吸納大量資金訓練的基座模型開始趨近同質化,它們成本高昂、越來越難和開源技術競爭,但人工智慧技術並沒有商品化。
就像 Windows 核心、Linux 核心這些已經比較商品化,但 Windows 軟體系統並沒有商品化,微軟多年還靠此賺了很多錢。零一萬物想要做的是填補 AI 圈還不存在的 Windows,並使用 DeepSeek 作為我們類 Windows 的核心之一。
彭博社:那麼,你認為現在的 AI 增加了什麼價值?對於投資人來說,在思考這個行業的價值增長點時,具體有哪些主要的經濟因素?而為什麼你認為只有三個玩家的空間?
李開復: 的確可能還有第四、第五個,但在多數市場中,大部分的終局最後將以寡頭局面收場。第一名賺了很多錢,第二名收支平衡,後頭幾名多半不能算是成功。在大模型的賽道中,由於底層模型很難直接轉化為商業模式,所以情況更加複雜。但一旦你是最終贏家,就有許多方法可以變現。近期我們可以看到的變化是,中美兩地的投資人幾乎不再下注更多更貴的底層模型公司。他們更願意投資 AI 應用、消費者應用、AI 基礎設施型別的創新企業,還有企業應用的廣大市場需求,未來每個應用、千行百業都會被 AI 重塑,這些應用能為企業提供真正的價值。所以,AI 相關的資本正轉往這些方向,而不再投入基座模型。
半導體技術封鎖的影響
彭博社:半導體技術封鎖是否會成為制約中國 AI 發展的一個限制因素?
李開復:我們可以回顧過去來理解這個問題。過去,中國總是能夠在底層技術方面迎頭趕上,並構建出偉大的工程產品,而美國更擅長取得前沿突破。我曾經在《AI 未來》這本書中深入論述這點,這種情況目前來看仍在繼續。
如今我們看到 DeepSeek 展現出了極強的適應性和競爭力,再次證明了“需求是創新之母”這一觀點。因為他們擁有比美國大廠少很多的 GPU,所以不得不設法把已有 GPU 的效率提高 10 倍。正因為 DeepSeek 擁有計算資源比美國大廠少了幾個數量級的,反而被迫更加精益求精,倒逼出的技術創新使得他們的模型訓練和推理成本比 OpenAI 和其他公司低五到十倍,讓全球刮目相看。
彭博社:大約幾個月前,在 2024 年的 10 月份我們曾經有過一次交流,當時零一萬物也推出了與 DeepSeek 相似的模型,並且早於 DeepSeek 釋出 V3 之前。您如何看待模型迭代的頻率?這種頻率是被什麼因素主導?DeepSeek 的成功是一種趨勢使然,還是產品本身的魅力?今年,大模型行業又會給我們什麼樣的驚喜?
李開復: 中國大模型行業的競爭仍會熱火朝天好一段時間,最終可能有三個贏家,美國可能有四個贏家,但這並不意味著其他幾十家公司會放棄競爭,所以我判斷那些正在快速發展壯大的公司會繼續高頻釋出新的模型和產品。在我看來,xAI、DeepSeek 是發展速度最快的公司。同時,OpenAI、阿里巴巴、谷歌和 Anthropic 都會做出令人敬佩的研究工作。
儘管字節跳動可能不在大多數人的視野裡,但我會把它列在名單上。位元組在大模型領域已經投入了海量資源。在前沿模型探索上敢於投入大量資金,其中一個最合理的邏輯是掌握了大量的使用者,當所投入的鉅額成本分攤到能獲利的大體量使用者平臺時,商業模式就能夠成立。基於字節跳動擁有最多的使用者、最多元化的商業變現模式,我做了這個預測。
彭博社:百度是個讓我印象深刻的公司,但不在你的名單上。此外,中國政府對 AI 的支援,有哪些變化?
李開復: 我們都非常尊重並感謝百度在中國真正開啟了 Transformer 革命。他們試圖聘請傑弗裡·辛頓,後來延攬了吳恩達。我認為這證明了李彥宏先生具有遠見。
另一個關於政府支援的問題。中國政府的一個重點工作方向被稱為“新質生產力”。這意味著利用高科技創造生產力、降本提效,並透過高新技術的引入,將所有傳統行業轉變為更具盈利能力和競爭力的行業,而 AI 正是其中的核心引擎。
彭博社:幾周前的民企座談會上,中國科技巨頭的 CEO 們與國家領導人同處一室,這種情形很少見。從這個角度來看,你認為政府會有哪些具體的措施來支援這一目標?
李開復: 我認為目前中國地方政府都在非常積極地擁抱 AI,各地都在探索如何將 AI 應用到當地的傳統優勢產業中,用技術打造“新質生產力”,進而促進城市 GDP 增長,這是一個從上到下都在貫徹落實的方向。對於地方政府來說,“新質生產力”是令人振奮的、非常有效的新增長點,零一萬物和其他友商公司都開放和地方政府及產業展開緊密的合作探索。
原文連結:
https://www.bloomberg.com/news/articles/2025-03-20/ai-pioneer-sees-handful-of-models-surviving-us-china-shakeout
宣告:本文為 AI前線翻譯整理,不代表平臺觀點,未經許可禁止轉載。
直播預告
🚀應屆生親測 DeepSeek 等 5 大 AI 寫論文!1 小時速成框架 / 文獻 / 排版✅
🔥3 月 21 日 19 點直播:AI 協同指南|工具包福利
⏰DDL 急救!掃碼預約領《DeepSeek 知識庫》,開播提醒不遲到👇

相關文章