英偉達股價大跌17%之際,DeepSeek再放大招

一款來自中國的AI大模型,轟動矽谷。1月27日,納斯達克100指數重挫3%,科技股暴跌,行業巨頭英偉達重挫17%,市值蒸發近6000億美元,創市場歷史之最。DeepSeek讓主要基於人工智慧熱潮的美股行情面臨考驗,投資者質疑高達數千億美元的人工智慧投資是否會帶來足夠大的利潤,以證明超大型股的估值合理。
1月28日凌晨,DeepSeek 再放大招:開源視覺多模態模型Janus-Pro-7B。
Janus在 GenEval和DPG-Bench 基準測試中擊敗了Stable Diffusion和OpenAI的DALL-E 3。Janus的表現超越了傳統的統一模型,並且在與任務特定模型的比較中也同樣表現出色。憑藉其簡潔、高靈活性和高效性的特點,Janus-Pro 成為下一代統一多模態模型的有力競爭者。
Janus-Pro 是先前工作 Janus 的進階版本。具體來說,Janus-Pro 整合了最佳化的訓練策略、擴充套件的訓練資料,以及更大模型規模的擴充套件。透過這些改進,Janus-Pro 在多模態理解和文字到影像指令遵循能力方面取得了顯著進展,同時還增強了文字到影像生成的穩定性。
Deepseek來自國產大模型公司深度求索(DeepSeek)。作為一家成立僅一年多的人工智慧(AI)初創公司,DeepSeek憑藉突破性的AI模型在矽谷收穫了驚歎和錯愕:該模型的效能不亞於全球最強的那些聊天機器人,而成本看起來只有它們的一個零頭。
DeepSeek的異軍突起,或對AI向前發展將需要越來越多電力和能源的普遍看法構成挑戰。月20日,該公司正式釋出推理大模型DeepSeek-R1。一經推出,DeepSeek-R1便憑藉其“物美價廉”的特性在海外開發者社群中引發了轟動。據稱R1模型開發成本只是競爭對手的一小部分。
DeepSeek表示,它使用了沒那麼先進的英偉達H800晶片打造了一個看上去與OpenAI最好的產品不相上下的模型,這種晶片在2023年10月前尚被美國政府允許出口至中國。據DeepSeek介紹,R1的預訓練費用只有557.6萬美元,在2048塊英偉達H800 GPU(針對中國市場的低配版GPU)叢集上執行55天完成。
在AI領域,巨頭們往往推行的是“大力出奇跡”的“燒錢”模式,花大價錢購買硬體和資料。GPT-4的訓練成本高達 7800 萬美元。就在1月24日,Meta CEO扎克伯格表示,為了實現公司在AI領域的目標,2025年年底,公司將擁有130萬塊GPU,資本支出將達到600億~650億美元。而根據此前財報的統計,谷歌的2024年資本支出或超480億美元。微軟和亞馬遜也預計2025年資本支出將繼續上行。
“DeepSeek顯示開發成本較低的強大AI模型是可能的,”Union Bancaire Privee董事總經理Vey-Sern Ling表示。“這可能會衝擊目前由少數科技巨頭高額支出來驅動整個AI供應鏈的投資邏輯。”
分析師Holger Zschaepitz表示:“中國的DeepSeek可能代表了對美國股市最大的威脅,因為他們似乎花極少的錢建立了一個突破性的AI模型,而且無需依賴最先進的晶片,這引發了質疑:在這個行業裡對數百億美元資本支出是否有用?”
長期以來,科技股的漲勢一直由英偉達和人工智慧概念股引領。DeepSeek是一個開源模型,似乎可以在較低規格的GPU上執行,可能會對英偉達的主導地位以及ChatGPT等其它熱門人工智慧提供商構成挑戰。
英偉達等現有的行業領導者雖然享有優勢,但也不能對AI主導地位想當然。中國的DeepSeek的出現暗示,競爭正在加劇,儘管現在可能並不構成重大威脅,但未來的競爭者會更快地變革,更快地挑戰老牌公司。英偉達1月27日稱DeepSeek模型是“出色的人工智慧進步”。

相關文章