速遞|見證歷史!DeepSeek中美兩區應用商店雙雙奪冠,ChatGPT第一次被中國應用超過了

圖片來源:DeepSeek
公開資料顯示,DeepSeek已成功登上中國和美國蘋果應用商店的免費應用榜單第一位。在美國市場,DeepSeek已超越ChatGPT,標誌著中國AI產品在全球市場上實現了歷史性突破。而在中國市場,DeepSeek也超越了豆包
美國對先進半導體的出口管制旨在減緩中國在人工智慧(AI)領域的進展,但實際上可能無意中促進了創新。由於無法僅依賴最新的硬體,DeepSeek這樣的公司被迫尋找創造性解決方案,在有限的資源下實現更多的功能。
更重要的是,中國正在採取開源戰略,並逐步成為全球最大、最強大的全開源AI模型提供者之一。
本月,DeepSeek釋出了其R1模型,採用了純強化學習等先進技術,打造出一款不僅是世界上最強大的模型之一,而且完全開源,任何人都可以檢查、修改並在其基礎上進行開發。
DeepSeek-R1展示了中國並未在AI競賽中落後,實際上,透過這一令人驚訝的開源戰略,中國可能會主導全球AI發展。透過開源具有競爭力的模型,中國公司能夠提升全球影響力,潛在地塑造國際AI標準和實踐。
開源專案還能夠吸引全球人才和資源,為中國的AI發展做出貢獻。這一戰略進一步使中國能夠將其技術擴充套件到發展中國家,可能將其AI系統——以及由此延伸的價值觀和規範——嵌入全球數字基礎設施。
DeepSeek-R1的效能在多個任務上與OpenAI的頂級推理模型相當,包括數學、程式設計和複雜推理。例如,在AIME 2024數學基準測試中,DeepSeek-R1的得分為79.8%,而OpenAI-o1為79.2%。在MATH-500基準測試中,DeepSeek-R1達到了97.3%,而o1為96.4%。在程式設計任務中,DeepSeek-R1在Codeforces上達到了96.3百分位,而o1為96.6百分位——儘管需要注意的是,基準測試結果可能並不完美,應該避免過度解讀。
然而,最值得稱道的是,DeepSeek主要透過創新而非依賴最新的計算晶片,達成了這一成就。
他們引入了MLA(多頭潛在注意力機制),它將記憶體使用量減少至常用MHA(多頭注意力)架構的5-13%。MHA是一種在AI中廣泛使用的技術,用於同時處理多個資訊流,但它需要大量記憶體。
為了使模型更高效,DeepSeek創造了DeepSeekMoESparse結構。“MoE”代表專家混合模型,意味著模型每次任務只使用少數幾個元件(或“專家”),而不是執行整個系統。“稀疏”部分指的是僅啟用必要的專家,從而節省計算能力並降低成本。
DeepSeek-R1的架構包含6710億個引數,但在操作過程中僅啟用37億個,展現了驚人的計算效率。公司已在GitHub上釋出了全面的技術報告,提供了關於模型架構和訓練過程的透明資訊。附帶的開原始碼包括模型的架構、訓練流程及相關元件,使研究人員能夠全面理解並複製其設計。
這些創新使DeepSeek的模型既強大又比其競爭對手顯著更具成本效益。這已經在中國引發了推理價格戰,預計這種趨勢將蔓延到全球。
DeepSeek收取的API使用費用僅為OpenAI-o1的極小一部分。這一成本的大幅下降有可能使得更小的組織和獨立研究人員能夠使用以前無法接觸的強大AI工具,從而實現AI技術的普及。
DeepSeek還開創了將其大模型能力蒸餾成更小、更高效模型的做法。這些蒸餾後的模型,引數範圍從15億到700億不等,也都開源,為研究社群提供了強大且高效的創新工具。
透過將其模型免費提供商業使用、蒸餾和修改,DeepSeek正在全球AI社群內建立良好的聲譽,並可能為AI開發的透明度設定新標準。
DeepSeek由梁文峰創辦,他是中國頂尖的量化投資人之一。他的對沖基金High-Flyer為公司的AI研究提供資金支援。
在一次採訪中,梁文峰向OpenAI發出了警告:“面對顛覆性技術,閉源所建的護城河是暫時的,甚至OpenAI的閉源方法也無法阻止其他公司趕超。”
DeepSeek是越來越多中國公司參與全球開源AI運動的一個例子,反駁了中國科技行業主要專注於模仿而非創新的看法。
今年9月,中國的阿里巴巴釋出了100多款新開源AI模型,作為Qwen 2.5系列的一部分,支援29種語言。中國搜尋巨頭百度有Ernie系列,智譜AI有GLM系列,MiniMax則推出了MiniMax-01系列,這些模型在效能上與美國領先的模型相比具備顯著的競爭力,並且成本大大降低。
隨著中國繼續投資並推動開源AI的發展,同時應對出口管制帶來的挑戰,全球技術格局很可能會在力量動態、合作模式和創新軌跡上發生進一步變化。這一戰略的成功可能使中國成為塑造AI未來發展的主導力量,對技術進步、經濟競爭力和地緣政治影響產生深遠影響。
參考資料:
[1] How small Chinese AI start-up DeepSeek shocked Silicon Valleym, https://www.ft.com/content/747a7b11-dcba-4aa5-8d25-403f56216d7e
歡迎掃碼加群參與討論
———END——–
我們相信認知能夠跨越階層,
致力於為年輕人提供高質量的科技、資本和商業內容。
青投創新,新型科創產業服務平臺,以科技、人才、資本為核心,透過內容出版、資料支援、產業諮詢、科技轉化等業務,為科技人才創業專案提供孵化及加速賦能服務,助力國家科技興國計劃。

相關文章