歷史首次,這款中國App同時榮登蘋果中美應用商店排行榜冠軍

近日,一家名為深度求索(DeepSeek)的中國AI初創企業在矽谷引起轟動,該公司憑藉成本效益高的語言模型DeepSeek-R1,與OpenAI的ChatGPT展開了競爭。1月27日,DeepSeek應用同時登頂蘋果中國區和美國區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。這也是歷史上首次中國應用能同期在中國和美區蘋果App Store佔據第一位。
就在前一日,DeepSeek曾出現短時閃崩現象。不少網友反映,使用時遇到 “伺服器繁忙” 的提示。對此,DeepSeek回應稱,當天下午確實出現了局部服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由於新模型釋出後,使用者訪問量激增,伺服器一時無法滿足大量使用者的併發需求。官方狀態頁並未將這一事件標記為事故。
目前,DeepSeek已推出兩款先進的AI語言模型:面向廣泛應用的DeepSeek-V3和旨在作為ChatGPT替代品的DeepSeek-R1。在一系列第三方基準測試中,DeepSeek的模型在從複雜問題解決到數學和程式設計等多個領域的準確性上,超越了Meta的Llama 3.1、OpenAI的GPT-4o以及Anthropic的Claude Sonnet 3.5。
據悉,成立於2023年的DeepSeek隸屬於中國量化交易公司幻方量化(High-Flyer),其創始人梁文峰曾是一位量化對沖基金經理。他組建了一支由來自中國頂尖大學的年輕且雄心勃勃的研究人員組成的團隊,併為他們提供了充足的資源和自由,以探索創新想法。這種方法推動了多頭潛在注意力架構(MLA)和混合專家架構(MoE)等突破性技術的發展,顯著減少了訓練模型所需的計算資源。
讓矽谷諸多AI巨頭感到震撼和汗顏的是DeepSeek的低廉成本。早在去年12月,該公司推出的DeepSeek-V3就透過最佳化模型架構和基礎設施等方式,展現了極致價效比。從該團隊正式釋出的技術報告來看,包括預訓練、上下文長度外推和後訓練在內,DeepSeek-V3訓練成本僅為558萬美元,不到GPT-4o的1/20,且只用了2048張H100的GPU叢集,用時僅53天。在同等水平下,哪怕是全球AI第一梯隊的頭部公司,至少也要用到1.6萬張以上的GPU進行訓練。
儘管尚不清楚最新發布的DeepSeek-R1的訓練成本,但其在服務價格上,相較效能相當的OpenAI的o1也有明顯優勢。DeepSeek-R1的API服務定價為每百萬輸入tokens 1元(快取命中)/ 4元(快取未命中),分別是OpenAI o1的2%和3.6%。
DeepSeek-V3和ChatGPT雖然都是先進的AI模型,但在關鍵方面存在差異。DeepSeek-V3針對中文理解和文化背景進行了最佳化,同時支援全球應用,並特別針對教育、醫療保健和客戶服務等行業進行了定製,尤其關注中國市場。相比之下,ChatGPT在全球多樣化的資料集上進行訓練,更強調英語和西方背景,廣泛應用於通用任務、創意寫作、編碼等多個領域。
外界普遍認為,美國尖端晶片出口管制等限制並沒有削弱中國的AI能力,反而似乎在推動DeepSeek等初創公司以優先考慮效率、資源池和協作的方式進行創新。
卡內基國際和平基金會的人工智慧研究員馬特·希恩(Matt Sheehan)表示:“美國的出口管制實際上將中國公司逼入了絕境,它們必須利用有限的計算資源提高效率。未來我們可能會看到大量與計算資源匱乏相關的整合。”
微軟執行長薩蒂亞·納德拉(Satya Nadella)在世界經濟論壇上談到DeepSeek時表示:“DeepSeek的新模型令人印象深刻,他們不僅有效地構建了一個開源模型,能夠在推理計算時高效執行,而且在計算效率方面表現出色。我們必須非常非常認真地對待中國的AI進步。”
值得一提的是,DeepSeek願意將其創新成果開源,使其在全球AI研究社群中獲得了更大的讚賞。 與專有模型不同,DeepSeek R1的程式碼和訓練方法在MIT許可證下完全開源,這意味著任何人都可以獲取、使用和修改該模型,沒有任何限制。
對許多中國AI公司來說,開發開源模型是趕超西方競爭對手的唯一方式,因為這樣可以吸引更多使用者和貢獻者,幫助模型不斷成長。在OpenAI逐漸封閉化的當下,DeepSeek的開源得到了AI從業人員的交口稱讚。
DeepSeek創始人梁文鋒在接受媒體採訪時也表示:“在顛覆性的技術面前,閉源形成的護城河是短暫的。即使OpenAI閉源,也無法阻止被別人趕超。”
Meta首席人工智慧科學家楊立昆(Yann LeCun)評論稱,DeepSeek成功的最大收穫不是來自中國競爭對手的加劇威脅,而是保持人工智慧模型開源的價值,以便任何人都能受益。“他們有了新的想法,並在其他人的工作基礎上加以實現。由於他們的工作成果已發表並開源,因此每個人都可以從中受益。”楊立昆表示,“這就是開放研究和開源的力量。”

相關文章