

近日,名為DeepSeek(深度求索)的中國AI初創公司在不到30天的時間裡先後釋出DeepSeek-V3和DeepSeek-R1兩款大模型,火爆全網,持續引發熱議。1月28日,一直被看作是美國人工智慧領域引領者的OpenAI公司的執行長薩姆·奧爾特曼(Sam Altman)終於在社交媒體平臺X上發聲,對DeepSeek-R1模型首次亮相表示歡迎,並表態將加快產品釋出速度並“提供更好的模型”。
他在推文中寫道:“DeepSeek的推理大模型R1是一款令人印象深刻的模型,尤其是考慮到其價效比。顯然,我們將推出更好的模型。有新的競爭對手加入,著實令人振奮。”
DeepSeek-R1模型之所以火爆科技圈,關鍵在於其只需要使用比OpenAI-o1低90%至95%的API呼叫成本,就可以在數學、程式設計和推理等關鍵領域達到與OpenAI-o1相媲美的表現。儘管如此,奧爾特曼仍堅持強調,仍然需要更多算力才能完成使命。
“最重要的是,我們很高興能繼續執行我們的研究路線圖,並相信更多的算力比以往任何時候都更重要,以成功完成我們的使命。”奧爾特曼補充道,“世界將會想要使用大量的人工智慧,並且會對下一代模型的到來感到非常驚訝。”
當地時間1月27日,受DeepSeek釋出新款大模型影響,美國股市開盤即大幅下跌,科技板塊尤為慘重。納指收跌超3%,英偉達股價暴跌17%,市值蒸發規模創美國股市史上最大,歐美晶片製造商以及為AI和資料中心供電的全產業鏈公司全軍覆沒。
市場分析認為,核心原因是中國人工智慧初創公司DeepSeek的最新突破,動搖了美國科技行業的“無敵”地位。此前,Visible Alpha彙編的資料顯示,考慮到提高AI能力需要大量的計算能力,微軟、Meta、Alphabet、亞馬遜和甲骨文已為2025年的資本支出預留了3100億美元,其中包括AI基礎設施。而DeepSeek以OpenAI及其競爭對手Anthropic、谷歌和Meta的一小部分預算進行競爭,引發了人們對投入到訓練系統的鉅額資金的質疑。
據報道,英偉達在股價暴跌後釋出宣告,稱DeepSeek的進步表明了其晶片在中國市場的有效性,未來將需要更多的英偉達晶片來滿足對DeepSeek的服務需求。
DeepSeek也引起了美國總統特朗普的注意。當地時間1月27日,他在佛羅里達州邁阿密舉行的共和黨會議上表示,中國人工智慧初創公司DeepSeek的崛起應當為美國企業敲響“警鐘”,美國公司“需要專注於競爭以贏得勝利。”同時,特朗普認為DeepSeek崛起也可能傳遞了一種積極訊號。
值得一提的是,1月28日,DeepSeek釋出開源多模態模型Janus-Pro,其中70億引數版本的Janus-Pro-7B模型在使用文字提示的影像生成排行榜中優於OpenAI的DALL-E 3和Stability AI的Stable Diffusion。
據悉,Janus-Pro是該公司去年釋出的Janus的高階版本,可顯著提高多模式理解和視覺生成。相比此前的Janus,Janus-Pro最佳化的訓練策略、擴充套件的訓練資料和擴充套件到更大的模型尺寸。透過這些改進,Janus-Pro在多模態理解和文字到影像的指令遵循能力方面都取得了顯著的進步,同時也增強了文字到影像生成的穩定性。
