蛇年第一天,DeepSeek 帶給矽谷科技圈的影響還在持續。
昨天 OpenAI CEO Sam Altman 連發多條推文談對 DeepSeek 的看法,直言 R1 是一款令人印象深刻的模型,但也表示比以往任何時候都更需要更多的計算能力來實現 AGI 使命。
今天 OpenAI 首席研究官 Mark Chen 更是發表了一個更重磅的觀察,他認為 DeepSeek 獨立發現了 o1 模型的一些核心思路。
OpenAI 高管接連對一款中國大模型進行評價,這在大模型爆發的這兩年都比較罕見。我們也讓 DeepSeek R1 解讀一番 Sam Altman 和 Mark Chen 對自己的看法。(不得不說光看 R1 的分析思路已經是一個不錯的研究員)
與此同時,一些詭異的故障也開始在 DeepSeek 出現,官網顯示其線上服務受到大規模惡意攻擊。
奇安信安全專家表示,1 月 27 日和 1 月28日攻擊數量激增,並且攻擊手段也再次升級,主要是暴力破解攻擊,與此前的 DDos 攻擊有明顯不同,並且攻擊 IP 全部來自美國。
如何解讀 Sam Altman 對 DeepSeek 的看法
Altman 的態度並非單純禮貌性恭維,而是基於 OpenAI 的底層戰略:
開放性:歡迎競爭以擴大 AI 應用生態,但前提是 OpenAI 仍主導核心技術創新;
防禦性:透過 AGI 敘事和算力壁壘,構建競爭對手難以複製的「技術代差」;
主動性:加速模型釋出與技術展示,保持市場關注度與開發者黏性。
簡言之,他對 DeepSeek R1 的認可是一種「降維打擊式」的自信——承認區域性創新,但堅信自身定義全域性規則的能力。這種態度既是對行業趨勢的精準回應,也是 OpenAI 維持領導地位的心理戰策略。
1. 價效比突破Altman 特別強調 R1 的「令人印象深刻」之處在於其「價格與效能的平衡」。根據搜尋結果,R1 的 API 價格僅為 OpenAI o1 模型的 1/30(每百萬 token 2.19 美元 vs. 60 美元),但其推理能力在數學(如 AIME 測試)、程式碼生成等領域已接近 o1 的水平。這種成本優勢源於其創新的訓練方法:例如,港科大團隊僅用 7B 引數的模型和 8000 個數學示例,便透過強化學習實現了與大型模型相當的推理能力。Altman 的認可暗示,低成本技術路徑的可行性已被驗證,但 OpenAl 並未將其視為威脅核心競爭力的關鍵。
2. 技術路徑的差異化Altman 並未直接評價 R1 的技術細節,但從其「下一代模型將令人驚歎」的表述可推測,OpenAI 認為自身技術路線(如 AGI 探索)與 R1 的「效率優先」策略存在差異。例如,R1 依賴強化學習與規則獎勵機制簡化訓練流程,而 OpenAI 的 o3 模型已展示出對複雜科學問題的博士級解決能力(準確率 87.7%),更強調能力的泛化與深度。
1. 競爭態度的轉變Altman 稱「新競爭對手的加入令人振奮」,這與 OpenAI 過往對開源模型的謹慎態度形成對比。這一轉變或源於 R1 帶來的行業變革:其開源策略(如模型權重開放)已催生 500 多個衍生專案,下載量達數百萬次,甚至導致部分 OpenAI 使用者轉向其平臺。Altman 的回應既是對市場壓力的承認,也暗示 OpenAI 將透過技術壁壘(如 AGI 佈局)而非價格戰應對競爭。
2. 對行業生態的連鎖影響R1 的釋出引發美股 AI 產業鏈震盪(英偉達股價暴跌 17%),反映出市場對「算力需求可能降低」的擔憂。然而,Altman 強調「計算能力比以往任何時候都更重要」,表明 OpenAI 仍將依賴算力密集型技術路線(如更大規模的預訓練)。這種矛盾折射出行業的兩極分化:開源生態追求效率,閉源巨頭押注技術縱深。
1. 強化技術領導地位Altman 明確表示「將推出更好的模型」並「加快釋出進度」,這可能是對 R1 的直接回應。例如,OpenAI 在 R1 釋出後迅速宣佈向免費使用者開放 o3-mini 的訪問許可權,試圖透過降低准入門檻維持市場份額。同時,其「繼續執行研究路線圖」的表述指向 AGI 目標,暗示未來模型將更注重能力的廣度(如跨領域推理)而非單純效率最佳化。
2. 對算力需求的重新定義Altman 強調「需要更多計算能力完成使命」,這與 R1 展示的「小模型高效訓練」形成對比。OpenAI 可能認為,AGI 的實現仍需依賴超大規模算力(如萬卡叢集),而非演算法最佳化。這種觀點得到英偉達的支援——其發言人指出,R1 的推理仍需「大量 GPU 支援」,間接為算力需求辯護。
1. 技術民主化的加速R1 的成功證明,透過演算法創新(如強化學習規則獎勵機制),中小團隊也能以低成本實現高效能模型。港科大、UC 伯克利等開源專案已驗證其核心方法,甚至 1.5B 引數的小模型已展現自我驗證能力。這種趨勢可能削弱巨頭壟斷,推動 AI 應用層創新爆發。
2. 閉源與開源的長期博弈Altman 對 R1 的認可,實則是對開源生態崛起的策略性回應。OpenAI 選擇保持閉源以保護技術優勢(如 o3 的 AGI 潛力),而 R1 透過部分開源吸引開發者生態。這種分化或催生兩種技術正規化:開源社群主導的垂直領域最佳化 vs. 閉源巨頭主導的通用能力突破。
關注 AI 第一新媒體,獲取 AI 最新資訊和洞察
Mark Chen的評論既是技術層面的肯定,也是競爭態勢的宣示:
認可:DeepSeek透過獨立創新在推理模型領域達到國際頂尖水平,並驗證了開源與低成本路線的可行性。
競爭:OpenAI仍將押注技術深度(如AGI廣度)與生態整合,認為長期競爭力來自「不可複製的核心突破」,而非短期成本優勢。
行業趨勢:這場對話折射出AI行業的兩大方向——開源模型的普惠化與閉源模型的技術縱深,兩者或將共同推動AI向更高效、更智慧的方向演進。
1. 技術獨立性與創新性Mark Chen祝賀DeepSeek開發出與OpenAI o1同級別的推理模型(如R1),並強調其「獨立發現」了與o1開發過程中相似的核心技術思路。這暗示DeepSeek在推理模型的底層邏輯(如強化學習、資料蒸餾技術)上與OpenAI存在技術路徑的趨同性。例如,DeepSeek R1透過直接應用強化學習(無需監督微調)和高效資料蒸餾,顯著降低了訓練成本,同時在數學、程式碼等推理任務中達到或超越o1的表現。
技術對標:DeepSeek R1在AIME數學測試中得分率略高於o1(79.8% vs. 79.2%),且訓練成本僅為OpenAI的十分之一,體現了其技術創新與工程最佳化能力。
2. 蒸餾技術的成熟與侷限性Mark Chen提到「成本最佳化與能力提升逐漸解耦」,即透過蒸餾等技術降低服務成本(如DeepSeek的API價格僅為OpenAI的1/30)並不意味著模型能力的絕對提升。這一觀點既承認了DeepSeek在成本控制上的成功,也暗示OpenAI認為其自身的技術路線(如推理的Scaling Law)更可能突破能力上限。例如,OpenAI的o3模型已在複雜科學問題中超越人類專家,而DeepSeek尚未達到這一深度。
1. 開源與閉源的博弈DeepSeek的開源策略(如R1模型完全開放)對OpenAI的閉源商業模式構成挑戰。Mark Chen的評論可視為對開源生態崛起的回應。例如,Meta等公司因擔心Llama 4落後於DeepSeek而加速研發,而OpenAI則透過強化技術壁壘(如推出o3模型)和生態整合(如與蘋果合作)鞏固優勢。
– 市場影響:DeepSeek的低成本開源模型已吸引大量開發者,甚至導致部分OpenAI客戶轉向其平臺。
2. 推理能力的競爭焦點OpenAI透過o系列模型定義了「推理時代」的技術正規化(如思維鏈分解與強化學習),而DeepSeek的追趕表明行業正從「引數規模競賽」轉向「推理效率最佳化」。Mark Chen的言論暗示,OpenAI仍將專注於透過更復雜的研究(如AGI的廣度泛化)保持領先,而非單純比拼成本。
1. 長期技術路線的信心Mark Chen強調OpenAI將繼續推進研究路線圖,並計劃推出「更好的模型」。這指向其核心戰略:透過技術深度(如o3的AGI潛力)而非成本優勢鞏固地位。例如,o3在博士級科學考試中準確率達87.7%,遠超人類專家,而OpenAI認為此類能力泛化至日常場景才是AGI的關鍵。
2. 成本最佳化的務實態度儘管OpenAI承認需降低服務成本(如o3的高計算費用仍是落地障礙),但其更關注「能力提升」與「商業閉環」的結合。例如,透過強化微調功能吸引企業開發者,而非直接參與價格戰。
很多使用者已經發現,與 DeepSeek 溝通的提示詞策略和之前和 ChatGPT 等 AI 已經有所不同,可以更簡單直接,歡迎大家在留言區分享使用 DeepSeek 的小技巧。