退出燒錢賽!李開復現身回應

2025.03.17
本文字數:1003,閱讀時長大約2分鐘

導讀:調整之後的零一萬物不再訓練萬億引數規模的超大基模,但仍會繼續做輕量化模型。
作者 | 第一財經 呂倩
DeepSeek爆火衝擊同行後,零一萬物迅速調整業務方向,被行業認為打響戰略調整第一槍。3月17日,零一萬物宣佈推出萬智企業大模型一站式平臺,為企業級DeepSeek部署定製解決方案。這也是零一披露業務調整後,創始人李開復首度現身回應。
李開復將當下稱為中國版ChatGPT Moment——“DeepSeek Moment”。他表示,DeepSeek不但是優秀的模型,且是開源模型,在國際上產生巨大影響力。
今年1月,李開復明確表態,公司未來不再做單一大模型,而是採取模型開放策略,研發能夠相容適配國內主流模型的產品。同月,零一萬物宣佈與阿里達成合作,共同成立“產業大模型聯合實驗室”,並在蘇州聯合七家垂直領域企業落地產業基地;2月,零一萬物宣佈在自有海外AI應用PopAi中接入DeepSeek-R1,成為國內AI六小虎中首家接入DeepSeek模型的公司。
轉型之後,零一萬物從基座大模型重投入調整為軟硬體解決方案提供商。李開復表示,萬智與市場上DeepSeek一體機的主要區別是提供完整的軟硬體結合解決方案,價格也會比大廠產品低。
DeepSeek爆火之後,雖然推出DeepSeek一體機、DeepSeek軟硬體解決方案的廠商眾多,但李開復表示,企業在技術合作與技術落地方面仍面臨幾大挑戰:一是部署方面,DeepSeek仍需要很多GPU與特殊配置,且資料安全方面仍面臨如何動手部署軟體的問題,而大部分一體機由整合商提供,後者在大模型方面缺乏豐富經驗。
其次,在應用層面,李開復表示,由於DeepSeek是基礎模型,暫時沒有支援商業應用所需的FunctionCall(函式呼叫)、Json Output(輕量級的資料交換格式)等,且DeepSeek R1目前在指令遵循方面尚未深度最佳化。每個企業都有自己的行業資料庫,都想即時聯網降低幻覺,但DeepSeek提供的聯網解決方案並不能滿足所有使用者的需求,有時不及時,有時不完整,此時應用的搭建對產業來說就是剛需。
第三大挑戰是定製難。李開復稱,DeepSeek雖然提供了開源模型,但並沒有提供預訓練和監督學習、強化學習的程式碼和解決方案。企業客戶做模型需要用到SFT(監督微調)、機器訓練、行業模型、預訓練CPT(持續預訓練),以及補充資料的蒸餾、標註等等,這些都需要一個平臺來幫企業客戶進行深度最佳化與定製服務。
目前,調整之後的零一萬物不再訓練萬億引數規模的超大基模,但仍會繼續做輕量化模型。李開復將2025年定義為AI-First應用爆發年,“這是一個巨大的機會,也是一個考驗。”他稱。
微信編輯生產隊的驢(還沒下工版)
推薦閱讀

一地官宣!生育三孩及以上補貼10萬


相關文章