
圖片來源 :DeepSeek
DeepSeek憑藉一款低成本AI推理模型在全球市場引發了超過1萬億美元的股市震盪,該模型的表現超越了許多西方競爭對手。
根據路透社的報道,DeepSeek正加速推出1月份釋出的R1模型的繼任者。DeepSeek原計劃於5月初發布R2,但現在希望儘早推出,但未透露具體時間表。。DeepSeek表示,新一代模型能夠提升程式碼生成能力,並擴充套件至更多非英語語言。
與此同時,行業競爭對手仍在評估R1的影響力。R1模型使用的是計算能力相對較弱的英偉達晶片,卻能夠與美國科技巨頭投入數千億美元打造的高階AI模型相媲美。
印度科技服務公司Zensar的營運長Vijayasimha Alilughatta表示:“DeepSeek的R2釋出可能會成為AI行業的一個關鍵轉折點。其在打造高性價比AI模型方面的成功,可能會促使全球各家公司加快自身研發步伐,打破目前少數幾家巨頭對該領域的壟斷。”
DeepSeek R2的釋出可能引發美國政府的進一步擔憂。美方長期以來將人工智慧視為國家戰略重點,而R2的推出或將進一步激勵中國企業加速佈局AI。目前,已有數十家中國企業表示正在將DeepSeek模型整合到其產品中。
關於DeepSeek,外界知之甚少。其創始人梁文峰憑藉量化對沖基金幻方量化躋身億萬富翁之列。據悉,他性格低調內斂,自2024年7月以來未曾接受任何媒體採訪。
路透社採訪了十餘名前員工,以及多位熟悉DeepSeek及其母公司High-Flyer運作的量化基金專業人士,並查閱了自2019年以來的相關研究論文、官方媒體報道及社交媒體資料。這些資訊勾勒出一幅獨特的企業圖景——DeepSeek更像是一個研究實驗室,而非傳統的營利性企業。
參考資料
[1] DeepSeek rushes to launch new AI model as China goes all in, https://www.reuters.com/technology/artificial-intelligence/deepseek-rushes-launch-new-ai-model-china-goes-all-2025-02-25/

———END——–
極思 TopMinds 相信認知能夠跨越階層,
致力於為年輕人提供高質量的科技、資本和商業內容。
