
一個科學家,幾個月前寫了一篇文章,宣示了他和他的公司透過強大的人工智慧解決全人類身心健康、心理疾病、貧困、和平、工作與生活的意義等諸多方面的美好善意。幾個月後,還是這名科學家,又突然釋出了一篇文章,強烈呼籲不應該讓任何一塊美國的晶片出口到中國,以限制中國人工智慧的發展,維繫人工智慧的“單極世界”(我很震驚他會赤裸裸地使用這個詞彙)。這件事,怎麼看都讓人覺得割裂,以及那麼一絲絲虛偽。
這個人就是人工智慧公司 Anthropic 的 創始人和 CEO Dario Amodei,一名義大利裔美國人、神經物理學博士、資深 AI 科學家、昔日的 OpenAI 研究團隊靈魂人物之一、中國公司百度的深度學習實驗室早期員工、號稱將打造最強大和安全的 AI 的理想主義者、OpenAI 最重要的競爭對手的創始人,以及現在,美國對中國 AI 全方位無死角禁運最激烈的呼籲者,沒有之一。
儘管 Anthropic 和它旗下的 Claude 系列模型在中國公眾當中的知名度相當有限,但畢竟,它是目前世界上最受 AI 應用開發者歡迎的大語言模型的提供者,在中國的 AI 研究人員和開發者群體中也有著相當多的擁躉。但是一夜之間,很多中國的 AI 從業者公開表示:Anthropic 和 Amodei 本人失去了他們最基本的尊重。
這就是一篇“檄文”的效應。
在這篇題為《關於 DeepSeek 和出口控制》的文章中,Dario Amodei 一方面雲淡風輕指稱 DeepSeek 取得的成就撼動美國 AI 的優勢被誇大描述了,在表達對 DeepSeek- V3 模型創新肯定的同時,堅決不承認引發更大轟動效應的 DeepSeek 推理模型 —— R1 的取得的突破(這廝在這一問題上的心思,是本文後面論述的重點)。他更不願意承認的是 DeepSeek 模型在算力成本和演算法效率上取得的成果—— 用一個自己也承認”未經過證實”的 DeepSeek 有五萬張走私而來的英偉達 A100、H100 和 H800 顯示卡的流言,力證 DeepSeek- V3 模型不可能用600萬美元的低成本訓練而成。顯然,Amodei 不能接受 DeepSeek 以演算法效率創新替代算力堆砌這個被日益普遍承認的路徑,因此不惜用一個連他自己也知道未經驗證的 DeepSeek 走私了大量高階顯示卡的前提實現了這個論述。但他又表述美國對中國的算力出口管制沒有失效——他可能恰好忘了他前面的論述建立在 DeepSeek 走私的假設上。

我們還原一下他的論述邏輯線條:DeepSeek 的影響力被誇大了—— V3 確實是個創新,但不可能花那麼少的錢——聽說他們走私了晶片——所以他們確實花了更多的訓練成本—— DeepSeek 沒有原創,它站在我們的研究基礎上當然成本更低—— R1 推理模型絕對沒有創新,只是復現 o1 的結果(裝作沒看見 OpenAI 已經承認了 DeepSeek 在推理上的成果是獨立的發現)—— 出口管制沒有失效,是對的(忘了自己前面的論述前提是 DeepSeek 獲得了走私顯示卡)—— 我們要打造一個 AI 的單極世界,中國絕對不能做出與我們水平相當的模型(忘了開頭說過 DeepSeek 不足為懼)—— 因此別說 H100 和 H800,最低端的 H20 都不能出口給中國,這樣中國就贏不了了。
你看,一個處處講邏輯和推理的科學家,試圖用一篇萬字長文論證一個無法自圓其說,但又要在形式上處處講邏輯的推理的結論,他就會顯得如此的笨拙,以及虛偽。
這並不是 Dario Amodei 第一次呼籲加強對中國的算力管制,你也沒法要求一個美國的人工智慧科學家對中國有與生俱來的善意,但他在 DeepSeek 引發了矽谷的廣泛關注、肯定和一定程度的恐慌的背景下,專門鼓譟對中國的算力出口進一步管制,以及極力否定 DeepSeek 在算力效率最佳化和模型推理方法上的創新,是非常值得關注和解析的現象。沒人期待他對中國的善意,但他對中國和中國誕生的 AI 公司 DeepSeek 的惡意和怨念如此之重,是很值得玩味的。
儘管極力推測 DeepSeek-V3 的訓練成本不止於600萬美元,但好在 Dario Amodei 確實承認了 V3 是真正的創新,但他又非要強調這並非突破性的,而是“持續成本降低曲線上一個預期的點”。他認為“不同之處在於,第一個展示預期成本降低的公司是中國公司,這在以前從未發生過,並且具有地緣政治意義”。這種夸人又不想真心實意誇的樣子,真的是讓人看著都累。我倒寧願看 Amodei 直接說:“美國公司都在做模型成本下降的創新,只是 DeepSeek 碰巧第一個做出來了而已”,可偏偏直爽不是他具備的品質。
到了 DeepSeek-R1 的時候,Amodei 倒是直爽了起來,他絕對不肯承認 R1 是突破性的成果,在這個問題上不留任何餘地,不顧就連訓練出強化學習模型 o1 和 o3 的 OpenAI 都承認了 R1 在強化學習的方法上做出了原創性的突破,也裝作對那些指出 DeepSeek 的強化學習擺脫了人類反饋的介入,是大語言模型 “AlphaGo 時刻”的研究結果視而不見。他堅持說:R1 只是在 V3 的基礎上進行了強化學習,它的所有動作都是在復現 o1,每一家美國 AI 公司都在進行這方面的推理嘗試,這是技術趨勢,跟開源也沒有關係,只是 DeepSeek 恰好先做出來了而已。

我們倒不必因為 Amodei 的嘴硬而忿忿不平,畢竟作為公認的 AI 領域卓有成就的研究者,Amodei 對一些關鍵問題的看法能在很大程度上影響 AI 業界、風險投資界、華爾街乃至華盛頓特區對 DeepSeek 現象的看法。這也是他為什麼必須跳出來的原因。他不是在為 OpenAI 鳴不平(他跟 OpenAI 之間的恩怨可深了去了),而是在這個時候,他必須出來給他一手創辦的 Anthropic 的下一步動作,找一個有臺階的鋪墊。
一個非常顯著的事實是:Anthropic 迄今沒有一款正式對外發布的推理模型。儘管 Dario Amodei 在接受採訪時曾公開表示他對單獨存在的推理模型不屑一顧——當時,他主要瞄準的當然是 OpenAI。
Amodei 的觀點是:推理沒有那麼難,基座模型更加重要。跟他暗戳戳地誇 DeepSeek-V3 有創新但在程式設計等方面的評測仍弱於他的 Claude 3.5 Sonnet 模型差不多,他公開承認過 o1 取得的突破,但又表示在一些具體的場景和實踐方面,作為一款預訓練模型的 Claude 3.5 Sonnet 展現了並不弱於 o1 的推理能力。因此,他不認為推理模型和普通模型應該分開,基於預訓練的基座模型仍然是更重要的,可將推理能力包容進去。
因此,非常可能發生的是:Anthropic 計劃用一種與 OpenAI 和 DeepSeek 不同或接近的方式,實現模型推理能力的躍遷,它將很可能在 Claude 的下一代旗艦基座模型中得到體現,且強化學習能力可圈可點。別忘了,三個月前,DeepMind 的強化學習靈魂人物、 Alpha 系列研究成果的核心貢獻者 Julian Schrittwieser 加入了 Anthropic。
完全脫胎於 OpenAI、將 OpenAI 視作最直接(幾乎是唯一)競爭對手的 Anthropic,某種意義上,是 OpenAI 在 前 GPT-4 時代一系列大語言模型理念的最原教旨主義信奉者。Amodei 多次站出來否認隨著訓練資料枯竭,預訓練出現了“撞牆”和規模效應遞減的現象,並一再強調經典意義上“Scaling Law”(即模型規模持續擴大才能導致效能增強)的重要性。AI 研究者和開發者在真切地期待 Anthropic 打破 Scaling Law 和預訓練模型的瓶頸,推出新一代的推理能力更強的旗艦預訓練模型。
但迄今為止,Anthropic 還沒推出這個東西。以它的出色模型訓練和從來不搞期貨釋出的歷史記錄,有理由相信 Anthropic 正在緊張地準備這個推理能力更強的預訓練模型,以證明 OpenAI 的 o1 不是實現推理能力提升的最佳路徑。事實上,Amodei 已經在接受《華爾街日報》的採訪中預告了。
但隨著 DeepSeek-V3 的推出,他們需要證明的東西突然一下子多了起來。
首先,DeepSeek-R1 繼 o1 之後進一步證明了強化學習的獨立推理模型的路徑是靠譜的,甚至可能是最佳的;其次,DeepSeek-R1 驗證了強化學習是能不需要人類反饋就能讓 AI 自主進行深度思考的(Dario Amodei 可是基於人類反饋的強化學習的主要發明者之一);再次,DeepSeek-R1 證明了實現這一切的訓練成本是可以明顯降低的。
這也就意味著,一旦 Anthropic 推出新的推理能力更強的基座模型,它要回答比過去更復雜的問題:強化學習能力比 R1 如何?基於人類反饋的強化學習究竟比 R1 代表的自主強化學習優勢在哪裡?以及,訓練成本是多少?有沒有更便宜、效率更高的方式?API 價格能不能降下來?(Claude API 是世界上最貴的,而 DeepSeek幾乎是最便宜的)
而這些棘手的問題和麻煩,都是 DeepSeek 帶來的。
因此,在推出自己的推理能力更強的新模型之前,Anthropic 的“靈魂人物” Dario Amodei 只能主動跳出來,極力降低和打消人們對DeepSeek-R1 先入為主的好印象:承認它是創新和突破是萬萬不能的,承認它成本真的降低了也是難以接受的。

這是兩條路線的問題,有點“你死我活”的味道。而這兩條路線,某種程度上也是在大語言模型的“後預訓練時代”,經典的矽谷式模型訓練和中國式模型訓練的兩條路徑的不同表徵:前者憑藉算力資源的優勢,透過算力堆砌的粗放式暴力美學提升模型效能;後者以演算法效率作為重點,透過架構和工程的創新降低訓練成本,同時提升模型效能。
Anthropic 甚至是比 OpenAI 更崇尚算力規模、模型規模和暴力美學的代表,這也導致了 Dario Amodei 這篇新發表的文章,不僅暗戳戳地釋放了對 DeepSeek 的惡意,更不加掩飾地將這種惡意投射給了整個中國的 AI 領域。
這不是 Dario Amodei 第一次公開呼籲加強對中國的算力出口管制,他之前就在接受採訪中表達過對華算力出口管制必要且需加強的觀點。美國的朋友們不應該對此表示遺憾,中國的朋友們也不必要為此憤怒,他一貫如此。
但藉著“ DeepSeek 效應”,Amodei 不失時機地撰文幾千字,以 DeepSeek 背後是中國人工智慧可能與美國並駕齊驅的趨勢,呼籲進一步加強對中國的算力管制,就顯得非常有意思了。相信我,當一個美國的科學家或企業家公開地表達對中國過於親密或敵視的態度時,他們的個人訴求是第一位的。
讓我們先重新審視一下 Anthropic 是什麼。
毫無疑問,它是美國也是世界當下最優秀的人工智慧公司——有時甚至沒有之一,Dario Amodei 是它在技術上的靈魂人物。比起貶低 DeepSeek 和談及算力出口管制時的自相矛盾和忸怩作態,他在談論起人工智慧的願景、侷限和解釋具體人工智慧術語和理論的時候,呈現的確實是一種令人信服的理智、剋制、清晰和精準,比他的前同事、確實不太懂技術的 OpenAI 執行長 Sam Altman 令人信服得多。
當然,作為 OpenAI 的主要競爭者,Anthropic 令外界印象最深的標籤是“安全”,這也是 OpenAI 最被詬病的地方。當然,它也確實為安全做了很多,比如將基於人類反饋的強化學習(RLHF)無處不在植入模型訓練全過程的“Constitutional AI” (憲法式人工智慧)原則。“安全”是 Anthropic 的賣點,有的時候也變成了它的負累。
2024年,Anthropic 在企業級市場搶走了 OpenAI 15%的市場份額,當然是因為Sonnet 3.5 模型確實強大,另一方面則是拜“安全”的護身符所賜。不過仔細想想,主打“安全”,除了瞄準的是企業使用者,還誰理應是主要的買家?
答案顯而易見:政府。準確地說,是美國政府。
可在參與聯邦政府和相關部門的專案上,Anthropic 作為後來者,顯然沒有 OpenAI 吃香。特朗普2.0 時代的首個AI 大專案——“星際之門”(Stargate),話事者是白宮,主要參與者是 OpenAI 和軟銀,沒有 Anthropic 的份兒。

儘管 Dario Amodei 隨即在達沃斯論壇上奚落特朗普政府的“星際之門” 是“一團混亂”,但很顯然,沒有哪家 AI 企業比 Anthropic 更希望參與美國政府主導的專案。為此,他也幹過一系列自相矛盾的事:
一方面,在特朗普即將正式就任前的1月6日,Dario Amodei 在《華爾街日報》發表署名文章《特朗普能確保美國 AI 的領先》,主動合作的投石問路頗為明顯。
另一方面,上一屆民主黨政府任期尾聲推出的備受爭議、致力於加強監管、要求人工智慧企業與政府主動分享模型研究成果的《前沿人工智慧模型的安全與保障創新法案》,幾乎遭到了矽谷來自進步和保守陣營的一致反對,最後被加州州長紐森拒絕簽署。而我們的 Dario Amodei,幾乎是全矽谷唯一讚成這一法案的人工智慧企業創始人。
過去,我曾經天真地認為 Anthropic 身上有早期 Google 的影子,因為這家企業將透明化、可解釋性和道德置於技術與產品的底層,有理想主義的光輝。可是,早期的 Google 是將這種原則內建在創始人和團隊的價值核心裡的,無論如何都並不主張靠監管和行政意志實現這一切。Google 的兩名創始人,從來也沒試圖將自己規訓為白宮的買辦。但我們的 Dario Amodei 可不是這樣。
可惜的是,充斥著矽谷新支持者的特朗普內閣,在人工智慧發展和監管上的理念與拜登內閣大相徑庭。至少目前看來,這個群體並不太買 Dario Amodei 的賬。在 Amodei 發表了那篇呼籲加強對華算力管制的奇文之後,支援特朗普的風險投資機構 Andreessen Horowitz 創始人Marc Andreessen 就出來打臉了:“閉源、不透明、吹毛求疵,尋求政治壟斷與開源和免費的對決,可不是美國需要的贏的方式”。
某種意義上,一心想獲得聯邦政府大單、希望參與國家級人工智慧“大專案”,拜登內閣時期無條件支援 AI 監管,特朗普當選後又吹捧特朗普才是確保美國 AI 領先的大救星的 Dario Amodei,目前事實上陷入的是生態上的孤立。他並不在美國 AI 政策制定的核心圈子裡,但他又非常想進去,這就讓他必須表現出一個更激進和決絕的姿態,獲得這張入場券。
在這個時候,DeepSeek 出現了,在強化學習的路徑上搞得他有些被動,但又給了他一個激進表態遏制中國人工智慧發展的好機會,偏偏 Anthropic 的模型訓練路徑依賴的又是算力堆砌的規模擴張,讓他不願意相信演算法效率和工程最佳化真的能降低算力成本,而相信卡死算力的脖子就能斷了中國 AI 的前路。而這個主張,偏偏又是白宮最容易聽懂和最可能接受的。於是,Amodei 如此痴迷於呼籲更嚴厲的算力出口管制,也就不難理解了。
還是忍不住感慨一句:美國新一代人工智慧企業的核心人物——無論 OpenAI 的 Sam Altman 還是 Anthropic 的Dario Amodei,甚至包括 Meta 的扎克伯格和 Scale.ai 的 Alexandr Wang,他們和他們的事業接受美國“國家主義”的規訓是如此的自然和迅速。而中國的大多數人工智慧企業家——最新的代表就是 DeepSeek 和他的創始人梁文鋒接受的“規訓”則是世界主義和全球化的。這真是一個有意思的現象。