AI一年過山車:從狂想到放下幻想丨晚點回望2024⑤

當 OpenAI 不再技驚全場,這是技術擴散的開始。
文丨賀乾明 張家豪 王與桐 李梓楠
製圖丨黃幀昕
編輯丨程曼祺 賀乾明
2024 年的開始,解決了 OpenAI 政變的山姆·阿爾特曼和天才科學家伊利亞·蘇茨克維重修於好,釋出影片生成模型 Sora,重演 ChatGPT 上線時的震撼。
在中國,阿里巴巴從年初起連續投資月之暗面、MiniMax 等大模型公司近 15 億美元,為 AI 創業公司送去新的彈藥。不久後,月之暗面創始人楊植麟在一次行業活動上被圍著要簽名——這是中國創投領域許多年未見的光景。
圖片、文字到影片,技術突破在 ChatGPT 釋出的第三年開了個好頭。行業關注點從模型、應用到商業化,要建立一套 AI 時代的商業模式;創業公司不斷融資,向大公司發起衝擊,誓要顛覆網際網路平臺,解鎖階層躍升的新機會。
然而到了年底,大部分樂觀期望已經落空。
OpenAI 的 Sora 延期 10 個月才釋出,實際效果不如年初的演示,和同行的影片生成模型同樣不再令人驚喜。同時讓 ChatGPT 變成現實的最關鍵人物——OpenAI 前首席科學家伊利亞·蘇茨克維、CTO 米拉·穆拉蒂、技術奠基者阿列克·拉德福德等盡數出走,GPT-5 至今仍未釋出 。
美國的行業第一不再能甩開對手;Character.ai 等一些明星公司的技術團隊已被收購,另一些正在找買家。中國大模型行業也在經歷類似調整,成為創業明星的楊植麟陷入股權風波;零一萬物不再追逐超大模型,部分團隊併入阿里。
技術突破放緩,AI 行業眼看著變成大公司的市場。靠著價格戰、應用矩陣和多團隊賽馬等依賴資源的競爭策略,Google、字節跳動等大公司展現出極強戰鬥力,開始掌握主動權。
樂觀的技術預期與略顯慘淡的現實之間,一些基於現有技術能做的應用探索陸續出現。
大公司把 AI 寫程式碼看作必備的工作流程;蘋果在內的手機廠商把 AI 裝進系統,微軟、Meta 等大廠加速把 AI 塞進數十億人用的產品中。
和許多新技術剛誕生時類似,普通人使用 AI 提高工作效率的進度,明顯落後於詐騙、色情等灰黑產業。據 Onfido 統計,2024 年,用 Deepfakes 技術欺騙身份驗證系統的嘗試增長了 3000%。韓國的 “N 號房” 出了 Deepfakes 升級版,警方一年抓了近 500 人。
我們選出 19 個節點,按時間脈絡呈現了過去這一年的劇烈變化。
從圖靈和馮諾伊曼造的巨型機器,到移動網際網路改造一切,計算機用了 80 年滲透進人類社會的幾乎所有環節,完成了 “軟體吞噬一切”。
現在的 AI 技術路徑是否可通向智慧(或所謂 AGI)還很可疑,但它已明確展示了將人開發軟體和使用軟體過程中的重複工作自動化的潛力。AI 的每一點進步都將被 80 年裡積累的計算機、軟體和網際網路基礎設施放大。
當人們對技術進展感到失望,改變才剛開始。當有一天人們不再討論 AI 時,真正的 “放緩” 才發生。現在只是故事的開端。
春節假還沒結束,Sora 點燃影片生成熱
2 月 15 日,大年初六,中國春節假期還沒結束,OpenAI 公佈影片生成模型 Sora 再次衝擊全球 AI 行業。3 個月前,OpenAI 剛經歷劇烈的管理權紛爭,但戰鬥力似乎沒受影響。
上海數個 AI 研究機構和 AI 公司負責人被叫去座談。中央廣播電臺臺長把介紹 Sora 的影片發給各中心負責人:“我們怎麼辦?這是總檯每一位同志都要深思的。”
一張梗圖迅速傳播:Sora 是寶座上的巨大神像,下面跪著 Runway、Pika、PixVerse 等其它十多個影片生成模型。
“能被放在第一排,我們很高興。” 推出 PixVerse 的愛詩科技創始人王長虎不久後告訴我們
“今年,影片生成模型會變得很實用。”MiniMax 創始人閆俊傑在 3 月時對我們預測
Sora 確立了 2024 年的第一個 AI 風向:大模型競爭已不限於 2023 年的文字、圖片,還拓展到了影片等更多模態,戰線更長了。
不過,Sora 當時展現的絲滑、連貫、逼真的 AI 生成影片,還只是 demo(演示),不是人人能用的產品。
可有什麼關係呢?這是 2024 年年初,信仰還很充沛,像這一年尚未翻開的日曆,仍是厚厚的一沓。
開年 8 億美元,中國 AI 有了 “阿里輪”
龍年剛開工,一筆 8 億美元融資重振 2023 年底有降溫跡象的中國 AI 投資。
改變遊戲節奏的是阿里。它在年前對大模型創業公司月之暗面的投資此時浮出水面,原本估值排名靠後的月之暗面一躍成為估值超 23 億美元的中國最貴大模型獨角獸之一。不久後,阿里又落定了與 MiniMax 的約 6 億美元投資。
阿里的出手,改變了創業公司的身位,也符合阿里在 AI 大模型時代的戰略:做智慧算力供應商。類似微軟與 OpenAI 的組合,阿里用算力加現金,投資了一批大模型公司。
2024 年上半年,據 IDC 統計,阿里雲在 GenAI IaaS(生成式 AI 公有云基礎層)市場的份額排名第一。
算上 2023 年的出手,阿里目前已投資了中國大模型六小龍中,除階躍星辰之外的 5 家公司,它們是智譜、百川智慧、零一萬物、月之暗面和 MiniMax(按投資披露順序)。
當美元在中國一級市場的存在感逐漸降低,“軟銀輪” 消失了,但至少在 2024 年上半年,中國 AI 還有 “阿里輪”。
可是然後呢?仍有能力和意願的 “接盤者” 下半年還有,只是其中不少因背景等考慮選擇了隱去姓名。
模型價格戰:GPT-4o 加量還降價,DeepSeek 帶著字節跳動
5 月 13 日,OpenAI 再次加熱市場:釋出跨模態新模型 GPT-4o。
它還開啟了把模型做大、做強之外的另一個最佳化方向:更有價效比。
4o 的文字處理能力相比 2023 年 11 月釋出的 GPT-4-Turbo 沒有顯著提升,但增加了端到端語音能力,API 價格還便宜了一半(注:模型輸入價格,下同)。7 月釋出的 GPT-4o mini,在 4o 基礎上又降了 30 倍。
此後,Google  和 Anthropic 的新模型打起價格戰:Google Gemini 1.5 Flash 在 8 月降價至 GPT-4o mini 的一半;Anthropic 6 月釋出的 Claude 3.5 Sonnet 號稱寫程式碼的能力是 GPT-4o 的 10 倍,但價格只有六成。
同在 5 月,DeepSeek 打響中國大模型價格戰,當時新發布的 DeepSeek-V2 的價格只有 GPT-4o 的 1/36。
此後 30 天裡,位元組、阿里、百度、騰訊全部降價。阿里通義和 DeepSeek 都在過去一年 3 次降價,每次降幅均超 85%。
模型降價,是因為訓練和推理成本在降。
2024 年 7 月釋出的 Llama 3.1 用了 16000 張 H100 來訓練,有 4050 億引數;11 月釋出的 DeepSeek-V3 引數規模達 6710 億,只用了 2024 張 H800。(H800 是英偉達針對中國市場的減配特供版,頻寬等引數比 H100 更低。)
據 a16z 的報告,大模型推理成本在過去三年降低了 1000 倍。
降價也是因為競爭。我們瞭解到,5 月剛降價時,位元組透過火山引擎銷售豆包大模型 API 是虧本的。為爭取客戶用豆包,位元組也會給一些同時在位元組生態做電商的客戶提升店鋪等級。
更便宜的模型,是應用繁榮的前提。歷史上,網際網路普及的一個關鍵驅動力也是網費下降和網速變快:2000 年,沒人線上看影片,下一部電影要 100 塊,當時中國只有 1700 萬網民。現在中國網民接近 10 億,誰還記得用 “貓” 連著電話線上網的歲月?
四家公司,兩股競爭:英偉達抵抗更多 “地心引力”
四家 AI 算力公司在 2024 年的走勢標記了 AI 晶片戰場中的兩種競爭。
在大模型軍備競賽中,英偉達延續王者地位:GPT-4o 釋出前後,英偉達 2024 年 Q1 季報出爐,其資料中心業務的收入和淨利潤同比漲了 4 倍和 6 倍,同月,英偉達股價大漲超 30%。
2024 年 6 月,英偉達市值一度超過微軟,來到 3.34 萬億美元,成為全球最貴公司。
為英偉達製造 GPU 的臺積電也在 10 月來到歷史新高,成為首個萬億美元的純製造公司。2024 年,臺積電 AI 晶片相關營收預計會是前一年的三倍。
可天下也苦英偉達久已,它在主要用作大模型的資料中心 GPU 市場的佔有率已達 97.7%。
2013 年之後,Google、亞馬遜就開始自研 AI 晶片 TPU,2023 年後,Meta 與蘋果也開始加入這一趨勢。
Google、Meta、蘋果的共同合作方是博通——第三家在 2024 年創歷史新高、市值破萬億美元的公司。
不同於賣生態 “全家桶” 的英偉達,博通為想自研 AI 晶片的大公司提供設計支援,其 2024 年的 AI 業務收入同比增長 220%。
英偉達 VS 大公司自研之外, 中美算力競爭是另一行業主題。
英偉達並不是 2024 年漲幅最多的 AI 晶片公司,最能讓股民賺錢的是寒武紀:其市值從前一年底的 562 億元增長至 2024 年 12 月底的 2747 億元,漲幅超 400%。另一家這年翻四番的中國公司是泡泡瑪特。
寒武紀仍在虧損,市銷率已高達 366.8 倍,英偉達為 30 倍,上證指數市銷率中位數僅為 1.7 倍。
華為沒有上市,寒武紀大漲,不僅因為它是一個稀缺標的,也因為不少人相信:在美國的晶片出口限制下,中國必須找到自己的算力出路。
GPT-5 難產;9.11 和 9.9 誰大?難倒一眾大模型 
年底有媒體報道,微軟原本預計 2024 年中 GPT-5 就會誕生。而到現在,市場仍未等到 GPT-5 釋出。
過去多年,大模型行業沿著一條被稱為 Scaling Laws 的洞察前行:用更多資料、更多算力,訓練更大規模的模型,就能顯著提升模型能力。
23 年 3 月釋出 GPT-4 後,OpenAI 就開始研發下一代模型,到去年底,他們至少訓練了兩遍 GPT-5,投入可能超過 10 億美元,但效能提升仍有限,這引發了大模型效能提升 “撞牆” 的討論——網際網路公開的優質資料幾乎全被大模型吞噬,還沒有誰找到有效的替代方案。
同時,在 GPT-5 沒出來的階段,人們用已有的模型越久,發現的漏洞和瑕疵就越多。
2024 年 7 月前後,社交媒體上開始討論一個看起來超簡單的問題:“9.11 和 9.9,誰大?”
已能識別出 10 多個都醫生都無法確認的疑難病因,或流暢同聲傳譯不同語言的大模型,卻總是告訴提問者:9.11>9.9。
蘋果的研究人員在一篇論文中討論了相似的情況,即使是大模型原本答對的問題,只要稍微調整問法,它就會出錯。比如:
奧利弗週五摘了 44 個獼猴桃,週六摘了 58 個,週日摘的數量是週五的兩倍,不過有 5 個小一些。奧利弗有多少個獼猴桃?
大模型可以算出奧利弗週日摘了 88 個獼猴桃,但總會減去 5 個。
“大模型可以匹配抽象的模式,但邏輯推理方面還不足。” 蘋果的研究者在論文中寫道。到現在,GPT-4o 等大模型還判斷不了 9.9 比 9.11 大。
2017 年的麻省理工畢業典禮上,蘋果 CEO 蒂姆·庫克(Tim Cook)曾對畢業生說:“我不擔心計算機像人類一樣思考。我更擔心人像計算機一樣思考。”
7 年過去,擔心開始變成現實。社交媒體上,有人真誠發問:9.11 不就是比 9.9 大嗎?
還好,o1 來了,開啟 Inference Scaling 新可能
OpenAI 在 9 月釋出 o1,它像一劑解藥,緩解了焦慮,續上了熱情:
  • 大模型能力提升放緩?o1 展現出模型花更多時間、更多算力回答問題(test-time compute),能力會持續提升。
  • 大模型邏輯推理差?o1 的定位就是推理模型。我們的測試中,每一次都能正確回答 9.11 與 9.9 誰大。
  • 大模型訓練缺少資料?o1 能生成新資料,現在已經成為大模型行業的資料基礎設施。
代價是,這樣的模型用起來會消耗更多算力,成本更高。但大公司和 VC 更在意前方還有沒有路,o1 至少指了一個方向。
o1 開啟了新一輪大模型的巨型投融資:10 月,OpenAI 宣佈融資 66 億美元;11 月,Anthropic 宣佈融資 40 億美元;12 月,xAI 宣佈融資 60 億美元 ……
據 Pitchbook 統計,2024 年全球大模型公司在一級市場籌集 560 億美元,僅 OpenAI、Anthropic、xAI 三家就佔近一半。
美國公司拿走了這些投資中的近 9 成,在單輪融資中獲得 10 億美元及以上的中國公司僅有一家:月之暗面。
馬斯克不信 AI 放緩,6 月開始建 10 萬卡叢集,122 天搞定
o1 還沒釋出前,狂人馬斯克不懼 AI 放緩,從 6 月到 9 月,其創立的 xAI 用 122 天建成了由 10 萬張 H100 組成的 Colossus 計算叢集,重新整理了人們對 “美國基建速度” 的認知。
建設這麼大的叢集,一般需要 3 年,馬斯克只用了 4 個月。他的超常規操作有:把原本應用在特斯拉的 12000 塊 GPU 調給了 xAI;用臨時的移動天然氣渦輪機供電,這樣就不用等當地政府的電力審批。
好奇的競爭對手,甚至租直升機飛到田納西州孟菲斯上空去偵察這座 AI 算力基地。
目前還沒有哪個大公司,敢先踩下算力投資的剎車。
儘管 GPT-5 被報道訓練遇阻,山姆·阿爾特曼依然在 2024 年 11 月說:“there is no wall”(沒有牆),馬斯克則說,很快就要把 10 萬卡計算叢集擴到 20 萬張,未來會是 100 萬張。
2024 年前三季度,微軟、Meta、Google、亞馬遜總計在 AI 算力中心上投入 1250 億美元。
為了解決資料中心供電,亞馬遜收購了與核電站直連的資料中心園區,美國核技術公司奧克洛計劃為 OpenAI 的資料中心新建一座小型核電站。
中國公司不甘人後。市場研究諮詢機構 Omdia 的最新資料顯示,字節跳動和騰訊 2024 年分別訂購了約 23 萬枚 H 系列 GPU,比 Meta、特斯拉、亞馬遜和 Google 都多。
Robotaxi 走出寒冬,百度、Waymo 擴張,特斯拉放話 2026 年 1 萬輛
Robotaxi(無人計程車)在 2024 年走出低谷。小馬智行 CTO 樓天城告訴我們:“最關鍵的是,真的有了規模化、常態化的全無人運營。”
6 月,已在武漢運營 2 年的百度蘿蔔快跑車輛增至 400 輛,存在感明顯上升,到 8 月時,其每日單量已超過 4000 單;Google 旗下的 Waymo,8 月在洛杉磯運營區中的單量則首次超過同區普通計程車;過去 6 個月,Waymo 每週總訂單量從 5 萬單增長至超 17 萬單。
到 10 月,馬斯克也釋出特斯拉 Robotaxi 計劃——將於 2025 年在加州和得州運營由 Model 3/Y 組成的 Robotaxi  車隊,2026 年組成一隻超 1 萬輛車的 Cybercab 車隊。
資本市場重新認可無人計程車的故事,快兩年沒拿到融資的小馬智行和文遠知行在 2024 年末成功上市。
Waymo 在這一年融資 56 億美元,創下 Robotaxi 單筆融資額紀錄,英國初創公司 Wayve 獲得 13 億美元融資,資方有英偉達、軟銀和微軟。
據各公司的計劃,全球 Robotaxi 市場將在 2025 年-2026 年開啟新擴張。
諾貝爾物理獎、化學獎都給了 AI,但是因為更早的研究
諾貝爾獎沒有計算機科學獎。今年 10 月,它把物理學獎、化學獎都頒給了 AI 科學家:
  • 物理學獎頒給約翰·霍普菲爾德(John Hopfield)和傑弗裡·辛頓(Geoffrey Hinton),表彰他們利用物理學原理,開發出了機器學習的基礎方法。
  • 化學獎頒給大衛·貝克(David Baker)、德米斯·哈薩比斯(Demis Hassabis)和約翰·賈姆珀(John Jumper),表彰他們開發出預測蛋白質結構或設計新型蛋白質的模型或計算工具。
他們獲獎不直接因為這兩年火熱的大語言模型——機器學習方法,復興於 2006 年前後,結合深度學習和分子生物學的嘗試則始於 2016 年。
在一次採訪中,貝克說, AI 想象力的爆發,是自己從頭開始製造蛋白質的核心。
從第谷在 500 年前用望遠鏡看到一顆新星,到牛頓在 400 前出版《自然哲學的數學原理》和《光學》,塑造現代科學的基礎方法逐漸成形——實驗觀測和數學推導。
而現在,AI(深度學習)正成為科學探索的新基礎。
OpenAI 的 o 系列模型,目標客戶之一就是科研機構。一位核聚變科學家感到驚訝:“它(o1)不僅知道要回答問題還缺什麼資訊,還能給出合理假設。”
已有 OpenAI 研究員宣稱:當前的模型,加上更多資料和充分的後訓練,足以解開黎曼猜想等數學難題。
AI 先搶誰的工作?程式設計師請睜眼
2024 年初,阿爾特曼在與比爾·蓋茨的對談中說:回到 10 年前,行業共識是 AI 會先替代藍領,再替代白領,現在卻反了過來,白領工作比藍領更危險。
一年過去,誰最危險的答案越來越清晰:程式設計師。
程式設計為大模型提供了一個近乎完美的試驗場。
相比其它專業工作,程式設計在網際網路上有多得多的優質公開資料,如開原始碼、技術文件、編碼教程和開發者問答等。
程式設計工作也高度結構化:複雜的底層程式碼數十年來已被封裝成各種標準化的 API 和 SDK,程式設計師只需像搭積木一樣呼叫這些模組。這個場景天然適合生成式人工智慧。
而且大模型生成的程式碼對不對,執行一下就知道,這也避免了大模型 “幻覺” 問題。
雖然微軟、Google 到 OpenAI、Anthropic 都在積極投入,還是有 Cursor、Dewin 這樣的新 AI 程式設計工具在 2024 年突圍。
大模型的程式設計能力,也沒有受到 Scaling Law 放緩的影響,OpenAI 最新的 o3,寫程式碼能力已排進人類程式設計師的 Top 200。
“未來十年,選擇成為程式設計師的回報將擴大 100 倍。” 幫 OpenAI、Google 等公司開發程式設計 AI 的 Turing 的 CEO 喬納森·西達哈特(Jonathan Siddharth)說,“單個程式設計師能利用這些 AI 系統完成更多的工作。”
人類程式設計師的職業發展也會進入新維度:好的想法,會比技能本身重要。
蘋果都想不好普通人該怎麼用 AI,全球出現 600 多個 AI 科比
據協同辦公應用 Slack 8 月公佈的對 15 個國家 1.7 萬名員工的調查,超 1/3 的受訪者說他們已在工作中用 AI。
他們用 AI 最多的 5 個場景分別是:給領導發信息、給同事發信息、評估下屬績效、給客戶寫郵件和頭腦風暴。
這也是蘋果眼中,大模型對普通人最有價值的場景。11 月,蘋果以此主題上線了一組廣告,宣傳 Apple Intelligence 如何幫鍾情摸魚的辦公室 “混子” 寫出讓領導刮目相看的郵件;幫未充分準備的彙報者應付開會 …… 這些廣告都以 “我是天才” 的背景音樂做結。
沒多久,蘋果被罵得關掉影片評論區。
Slack 的調研中還提到另一個數據:使用 AI 的員工中,有近一半(48%)不願告訴領導自己在工作中用了 AI——他們擔心領導覺得他們懶、騙人或無能。
Slack 的調查和蘋果的廣告,都指向一個事實:普通人在工作、生活中到底怎麼用好 AI,其實還沒有好答案。
讓人滿意的用途沒出現,AI 產品就已經非常同質化,一個註腳是:2024 年,全球各類 AI 聊天應用中,出現了無數個 “AI 科比”。
在我們統計的 8 個大模型應用中,就有 626 個科比分身。我們還在位元組旗下的貓箱中發現至少 200 個科比分身,多到數不過來。
探索到底怎麼用 AI 的嘗試還會繼續:Google 釋出了 NotebookLM,可以把任何資料轉成柏拉圖式的對話播客;OpenAI 在想盡辦法給 ChatGPT 擴充套件功能;位元組內部也開始反思,豆包那樣的形態會不會是個中間形態?臨近年底,又有了 AI Agent(智慧體)這個新風口。
詐騙和色情,AI 雙刃劍的另一面
更強的 AI 也在帶來更多有害使用。2024 年,Deepfake 引發的負面社會事件爆發式增長。
以假亂真的換臉技術,被用於製作虛假色情內容、侵犯他人隱私和狡詐、勒索,灰產行業有一個專門的詞:“黃敲”。
韓國 “N 號房事件 2.0” 爆發:在一個近 23 萬人的群組中,群員只要上傳熟人照片並付費,就能在 5 秒後得到 AI 生成的裸體合成圖。僅在 2024 年前 8 個月,就有超 600 名受害者出現;前 10 個月裡,韓國抓獲了 474 名與 Deepfake 相關的犯罪嫌疑人。
香港也在 2024 年披露一起創紀錄的金融詐騙:一家跨國公司在香港的員工受該公司英國總部 CFO 的邀請進行視訊會議,而這場會議的其它參會者,包括 “CFO”,全是使用換臉和語音合成技術的 “偽人”。後來這位員工前後轉賬 15 次,公司損失了 2 億港幣。
一些政府已在提前應對:2024 年 5 月,歐盟國家正式批准《人工智慧法案》,大部分規則將於 2026 年 8 月 2 日開始生效。
很難說這些手段是否有效,相比技術、算力和融資競爭,對 AI 風險的關注與討論要少得多。
歷史學家尤瓦爾·赫拉利在 2024 年的新書《智人之上》中說,認為人類能像過去 “混過” 工業革命那樣也混過人工智慧變革,即低估了人工智慧的不同本質,也低估了過往技術革命的負面影響:工業革命極大提升了生產力,但 “也帶來了帝國主義與納粹的災難性試驗。”
人類已出現 3 萬年,而科學革命和後來的技術爆發只發生在最後 500 年,且迭代速度正越來越快;在破壞式創新中轉危為安,並非必然,可能只是幸運。
AI 硬體虛火:不靠 AI 的 RayBan-Meta 全年賣出近 200 萬;AI Pin 發售不久被傳賣身
軟體應用之外,新的硬體載體是 AI 創新的另一主線。
不過 2024 年,賣得最好的 AI 硬體,熱銷並非因為 AI。
2023 年 9 月上市的 Ray-Ban Meta 眼鏡在 15 個月內賣出 200 萬副,再次啟用智慧眼鏡市場。但它其實沒那麼智慧:它被使用最多的功能是聽音樂和拍照,都與 AI 無關。
Ray-Ban Meta  的成功,主要因為它是好戴、好看、好買:頂著 Ray-Ban 經典造型,重 49 克,與正常墨鏡相仿,主要透過 Ray-Ban 線下渠道銷售,美國使用者還可使用保險免去一部分配鏡費。
來自芬蘭的創業公司 Oura 也稱其 Oura ring 智慧戒指四代產品累計賣了超 250 萬枚(但僅有第四代新產品有 AI 功能), 2024 年銷售額約 5 億美元。在 2024 年底新一輪 5.5 億美元融資後,這家公司估值來到 52 億美元,超過中國任何一家大模型創業公司。Oura ring 的 AI 功能僅為問一些簡單的問題和分析你的健康指數。
那些更 “AI 原生” 的硬體卻處境艱難。
2024 年初,由阿爾特曼投資的明星專案 AI Pin 正式發售,目前總共售出約 10000 臺。2024 年 5 月到 8 月,其退貨量超過了新增銷量。6 月,AI Pin  母公司 Humane  開始以 10 億美元估值尋求出售,至今未見買家。
前渡鴉創始人呂騁的新專案 Rabbit R1,也先熱後冷。今年 9 月,呂騁透露,R1 日活躍使用者已降至大約 5000 人,不足銷量的五分之一。
創業者和投資人期待 AI 硬體是下一個智慧手機級別的大機會,它理論上應該有一套新的硬體特性和作業系統,比如 always on(如眼鏡能持續觀察外界)。但目前還沒有人能系統地說清楚,下一代平臺可能會長什麼樣。
人形機器人還是概念,這才是 “大 A” 賺錢時
雖然特斯拉人形機器人 Optimus 給中國供應鏈的訂單懸而未決,且量產時間數次延後,但二級分析師們已經幫特斯拉規劃好了供應鏈。 
A 股機器人領域的大部分個股在特斯拉 10 月 10 日的 WeRobot 釋出會後累計上漲超 70% ,其中部分供應鏈個股 4 個月漲幅超英偉達全年——做絲槓的北特科技漲了 350% ,做機械手的拓斯達漲了 180% 。
WeRobot 釋出會上,Optimus 能跳舞、給客人倒酒等,流暢對話,組織現場來賓一起唱生日歌。但這些驚人的效果,得益於人類遠端操控,Optimus 還無法自主完成這些事。他們現在也無法在工廠與人類競爭需要專業技能的崗位。
但恰恰是這個從 0 到 1  的階段,最適宜被炒作——這些公司現在沒有訂單,因而有無法被證偽的想象力——這是一個全球首富口中,比人類歷史上所有制造業都更宏大的生意。
就在 1 月 9 日,當馬斯克宣佈要在 2025 年製造數千臺 Optimus,並在 2026 年將產能提升 10 倍時,新一輪炒作又開始了,特斯拉供應商三花智控後續兩個交易日接連漲停。
現階段,真正靠機器人賺到錢的可能就是特斯拉、券商和部分股民。特斯拉近期上架了售價 199 元的 Optimus 官方模型,數萬個備貨,半天就賣完了。
理念與利益之爭:馬斯克狀告阿爾特曼,月之暗面陷股權風波
AI 的價值還沒完全兌現,圍繞價值的爭議已經上演。
阿里年初的大額投資和增速超 300% 的明星產品,讓月之暗面楊植麟成為中國最出名的 AI 創業者。而到 11 月,圍繞楊植麟的新聞是,他參與創立的上一家公司——迴圈智慧的 5 家股東在香港提交仲裁,稱楊植麟和迴圈另一位聯創張宇韜,在尚未獲得迴圈投資方豁免時,就已啟動創立月之暗面。
隨後,迴圈投資方之一,金沙江管理合夥人朱嘯虎又稱月之暗面的一位聯創,金沙江前合夥人張予彤 “違背受託責任”,在未從金沙江離職,且其它迴圈股東不知情的情況下,持有月之暗面股份,還在推動月暗成立的相關董事會決議上作為金沙江派駐迴圈的董事簽了字。
不少人認為這是一場利益糾紛,其實其中也有理念之爭:天才是否就有豁免權,創業的法規底線在哪裡?多大程度上可以先上車後買票?
大洋彼岸,同在 11 月前後,馬斯克起訴 OpenAI 及其 CEO 阿爾特曼,稱 OpenAI 違背創業初始的協議——以非營利機構阻止 AI 作惡。馬斯克希望阻擊 OpenAI 向營利機構的轉型。
這看起來是理念之爭,但也有利益與控制權的爭奪。我們翻譯了該訴訟中披露的 75 封馬斯克與阿爾特曼等人的郵件和簡訊來往
歷史資訊顯示,馬斯克也曾同意 OpenAI 在發展到一定階段後成為營利機構,只是,他想自己做 CEO。 
DeepSeek、Qwen,中國開源模型給美國同行一點壓力
至少在有一個方面,中國大模型在 2024 年真的趕上了美國——開源。
2024 年 1 月,在 Chatbot Arena 的排名中,全球前 6 的開源模型中只有一箇中國模型——零一萬物開發的 yi-34b-chat,到 12 月,這個數字增長到 3.5——0.5 是因為,其中有一個非中國的開源模型,是基於阿里 Qwen 2.5 72B 訓練的。
12 月釋出的 DeepSeek-V3 近期又在多項評測中超越了 9 月釋出的 Qwen 2.5-72B 和 7 月釋出的 Llama-3.1-405B 等開源模型,排名比 Llama 3.1 高出 8 位。
開源模型和閉源模型的差距也在縮小。今年 1 月,Chatbot Arena 表現最好的開源模型 mistral-medium 與當時最好的閉源模型的評分差距為 99 分,到 12 月時,排名最好的開源模型 deepseek-v3 與最好閉源模型 gemini-exp-1206 的分差則縮小至 58 分。
Deepseek-v3 的訓練成本僅為 557.6 萬美元,是效果相似的美國模型的十分之一。這是越來越多中國公司做大模型的方式——靠更強的工程能力,花更少的錢,訓練出效果頂尖的模型。
開源 AI 平臺 Stability AI 研究主管 Tanishq Mathew Abraham 曾在社交平臺上說:“許多最具競爭力的開源大模型,包括 Qwen、Yi、InternLM、DeepSeek、BGE、CogVLM 等正是來自中國……他們正在為生態系統和社群做出重大貢獻。”
GPT-4 年第 1,年底 42,模型 “保鮮期” 變短,技術擴散加速
年初最強的大模型 GPT-4,年底已經變得稀鬆平常,其在大模型競技場 Chatbot Arena 上的排名已滑落到 42 位。
新模型的 “保鮮期” 也越來越短,每個月排在前列的模型都會被新出現的模型擠下去。
頭部模型之間的差距變得越來越小:24 年初,第 1 的模型分數比第 15 名高出 143 分,而到了年底,分差來到 75——縮窄近一半。
與此同時,阿爾特曼鞏固權力後, OpenAI 高層在 2024 年幾乎換血一遍。我們曾詳細介紹過 OpenAI 核心員工流向,他們直接推動了 OpenAI 的大模型技術擴散
Lepton.ai 創始人、AI 框架 Caffe 作者之一賈揚清最近在朋友圈分享:“大模型技術的擴散速度超乎想象,試圖透過模型本身產生通用場景壁壘幾乎不可能。”
半熟技術遇上半新市場:大廠崛起,創業公司退出
競爭越來越激烈的 2024 年,大模型創業公司進入收縮狀態。在海外,融資數十億美元的 Inflection、Character.ai、Adept 紛紛把訓練大模型的團隊賣給大公司。
在中國,大模型六小龍之一的零一萬物也在 2025 年初把部分訓練大模型的團隊併入阿里,加入另一與阿里雲成立的 “產業大模型聯合實驗室”。零一萬物將不再追求訓練超大模型。
“創業公司去和大廠比,誰能燒出更大的模型,最終不會成功。” 零一萬物 CEO 李開復告訴我們。
我們此前在《中國大模型生存戰》一文中寫道,大模型當前是半熟的技術遇上半新的市場的故事:“如果大模型能力提升短期遇阻,應用開發和產品表現會更依賴現有移動網際網路基礎設施,這就是一個燒錢、拼資源的遊戲。”
這是大廠更擅長的戰場。過去一年,Google 戰鬥力顯現,其模型現在霸佔了大模型競技場前三。國內的字節跳動也後來居上,豆包成為中國使用者規模最大的大模型應用。
據媒體報道,位元組將在 2025 年斥資 200 美元投資 AI 算力,其中 70 億美元會用於英偉達新款 GPU 以訓練大模型;為了提高資料傳輸的效率,位元組還打算像 Google 那樣,投資海底電纜。
Sora 終於全量釋出:最初的驚才絕豔,最後的泯然眾人
彷彿一條咬尾蛇,OpenAI 終於在 2024 年底收回 Sora 伏筆,在連續 12 天的線上釋出會中,正式上線 Sora 產品。
可此時,Sora 已從年初的驚豔,走向泯然眾人。
在 Sora 從 Demo 到產品的這一年裡:Google 從 OpenAI 挖走了 Sora 的核心開發者之一蒂姆·布魯克斯(Tim Brooks)。Sora 放開後不久,Google 就推出影片生成模型 Veo 2,稱它可以生成解析度高達 4K、長度超過 2 分鐘的影片——指標都超過 Sora。
位元組、快手、騰訊、阿里等大公司和 RunWay、Pika、MiniMax、智譜 AI、愛詩、生數等創業公司,都推出或更新了影片生成模型和產品。
我們測試了 Sora 與市面上的部分影片生成模型,Sora 談不上領先。它的實際效果不如年初 demo 裡的展示。
中國公司開發的影片生成模型與 OpenAI 的 Sora 對比,我們選用的是各家生成時長、速度與 Sora 接近的版本 *。
OpenAI 已開始準備新模型了。阿爾特曼近期接受採訪說,他很少參與研究團隊的計劃,但 “最近給 Sora 團隊寫了幾頁相當詳細的建議,告訴他們未來三個月應該做些什麼”。
這個採訪釋出的第二天,從 OpenAI 跳槽到 Google 的布魯克斯宣佈組建團隊,要招聘研究者一起開發 “世界模型”——這是 OpenAI 設想的 Sora 的未來。
從驚豔到平平無奇,看起來是一條下劃線,其實是整個 AI 領域快速發展的一個寫照。
當 OpenAI 不再技驚全場,這是技術擴散的開始;當有一天 AI 不再被討論和在意,才是 AI 真正改造生活的標誌。
題圖來源:《致命魔術》
·  FIN  ·


相關文章