作者:澤南
最近一段時間,各家新勢力都在角力部署端到端的智慧駕駛系統。
作為公認的新正規化,它可以讓整個智慧駕駛系統反應更快,更加擬人,能處理以往方法無法解決的大量 corner case,被認為是自動駕駛通向 L3、L4 的正確方向。
在國內,小鵬於去年 7 月就宣佈了量產端到端大模型上車,並構建了從算力、演算法到資料的全面體系,在端到端方向上一直保持著領先的身位。
本週,小鵬在 AI 技術分享會上介紹了自己在智慧駕駛領域的重要突破和進展,首次披露了正在研發 720 億引數的超大規模自動駕駛大模型,即「小鵬世界基座模型」。
小鵬的技術人員表示,在物理世界,資訊和模態的複雜程度要比數字世界複雜數倍,自動駕駛本質上是物理世界中的複雜 AI 問題,也是具身智慧的第一步。
小鵬發展的雲端世界基座模型以大語言模型為骨幹,使用海量的優質多模態駕駛資料進行訓練,具備視覺理解、鏈式推理和動作生成能力。透過強化學習訓練,其基座模型可以不斷自我進化,逐步發展出更全面、更擬人的自動駕駛技術。

小鵬汽車自動駕駛負責人李力耘表示,小鵬早在去年就開始佈局 AI 基礎設施,建成了國內汽車行業首個萬卡智算叢集,用以支援基座模型的預訓練、後訓練、模型蒸餾、車端模型訓練等任務,小鵬將這套從雲到端的生產流程稱為「雲端模型工廠」。
端到端大模型雖然是各家車企的共識,但仍然面臨著算力等瓶頸。當前主流的智駕系統,如執行在 2× 英偉達 Orin 晶片上的系統,大部分只能支援 0.5-1 億引數,在部署時必須對學習到的知識進行取捨。相比之下,雲端大模型體量可以達到車端模型的 140 倍以上。
自去年下半年開始,小鵬面向 L4 級別的自動駕駛啟動研發全新的「AI 大腦」,即小鵬世界基座模型。
其團隊利用優質自動駕駛訓練資料先後開發了多個尺寸的基座模型,目前正在著手推進 72B(72 Billion,即 720 億)超大規模引數世界基座模型的研發,引數量是主流 VLA 模型的 35 倍左右。

據介紹,該模型的一大優勢是具備鏈式推理能力(CoT),能在充分理解現實世界的基礎上像人類一樣進行復雜常識推理,並做出行動決策,如輸出方向盤、剎車等控制訊號,實現和物理世界的互動。
小鵬希望透過基座模型的能力讓智駕系統從「模仿人類」進化到「超越人類」,最終能夠處理全場景的自動駕駛問題,包括一些模型從未在訓練資料中遇到的問題。
更進一步,端到端模型的研究也可以延伸到整個具身智慧領域。李力耘表示:「世界基座模型是小鵬自動駕駛真正走向 L3、L4 的基礎,也會是未來小鵬所有物理 AI 終端的通用模型。」
從零打造雲端模型工廠
小鵬的雲端模型工廠「車間」涵蓋基座模型預訓練和後訓練(強化學習)、模型蒸餾、車端模型預訓練到部署上車的完整生產鏈路。整個體系採用強化學習、模型蒸餾的技術路線,能夠生產出小體量、高智慧的端側模型,甚至為不同需求的汽車定製不同的「大腦」,讓「千人千面」的模型研發成為可能。

目前,小鵬依靠自有萬卡叢集已擁有 10 EFLOPS 的算力,叢集執行效率常年保持在 90% 以上,從雲到端的全鏈路迭代週期可達平均 5 天一次。
小鵬世界基座模型負責人劉博士介紹,多模態模型訓練的主要瓶頸不僅是 GPU,也需要解決資料訪問的效率問題。小鵬汽車自主開發了底層的資料基礎設施(Data Infra),使資料上傳規模提升 22 倍、訓練中的資料頻寬提升 15 倍;透過聯合最佳化 GPU / CPU 以及網路 I/O,最終使模型訓練速度提升了 5 倍。目前,小鵬汽車用於訓練基座模型的影片資料量已達到 2000 萬 clips,這一數字今年還將增加到 2 億 clips。
依託強大的 AI 算力基礎設施和資料處理機制,小鵬開啟了全新的基座模型研發正規化,從雲端模型預訓練到車端模型部署,整個「雲端模型工廠」的迭代週期達到平均 5 天一次。
三大階段性成果
在率先量產端到端大模型的同時,小鵬在物理世界大模型研發上也再進一步,其分享了基礎大模型研發的三個階段性成果:
驗證了 Scaling Laws 在自動駕駛領域持續生效:

在後裝算力的車端上成功實現基模控車:

啟動 72B 引數模型訓練,搭建針對強化學習的模型訓練框架:

規模法則(Scaling Law)揭示了大模型的效能隨著模型的計算量、訓練資料量和引數量的提升而提升,在大語言模型(LLM)領域一直是人們追逐的目標。而在自動駕駛領域上,訓練資料遠不止單模態的文字資料,還包括攝像頭、雷射雷達等關於物理世界的多模態資料,本質上,這要求模型對物理世界形成認知和理解。
小鵬團隊首次驗證了 Scaling Laws 在自動駕駛領域持續生效,劉博士表示:「過去一年,我們做了大量實驗,在 10 億、30 億、70 億、720 億引數的模型上都看到了明顯的規模法則效應:引數規模越大,模型的能力越強。同樣的模型大小,訓練資料量越大,模型的能力也會越強。」
不久前,小鵬實踐了理論,在後裝算力的車端上用小尺寸模型實現了控車。儘管只是非常早期的實車測試,全新基模已經展現出令人驚訝的智駕能力。例如模型在未訓練的情況下就能適應香港的右舵駕駛環境。
在 AI 技術上,小鵬也一直在探索最新方向,自去年就已開始研發大模型中的強化學習技術。強化學習能夠幫助模型自我進化,學會處理訓練資料中未出現的長尾問題,做到更安全的自動駕駛。只有足夠強大的基座模型,才能被強化學習不斷激發出能力上限。這也是小鵬汽車選擇雲端蒸餾路線的原因之一:在雲端不計成本地訓練出高智慧、泛化能力強的模型,再將其蒸餾到適配車端算力的小模型上,才可以讓車端模型的效能超越算力限制。
值得一提的是,強化學習、雲端蒸餾等技術的思路,在今年初爆火的 DeepSeek R1 中得到了驗證,目前正在逐漸成為行業共識。
基礎模型是小鵬汽車 AI 化轉型的重要一步,不過在智慧駕駛的大模型時代,過去規則時代的經驗仍能發揮作用。在開發強化學習的獎勵模型(Reward Model)時,小鵬研發團隊基於規則經驗設計了獎勵函式,將規則時代的沉澱轉化為了新的生產力。

小鵬也在推動世界模型(World Model)的研發,小鵬的世界模型是一種即時建模和反饋系統,能夠基於動作訊號模擬出真實環境狀態,渲染場景,並生成場景內其他智慧體(即交通參與者)的響應,從而構建一個閉環的反饋網路,可以幫助基座模型不斷進化,逐漸突破過去「模仿學習」的天花板。
這也意味著人們能夠以更有效的方式構建新模型,產生新能力。小鵬工程師表示,我們或許可以像黃仁勳展望的那樣,用 AI 模型來生成一個新模型。
據介紹,小鵬世界基座模型研發和訓練成果更多的細節,預計還會再今年 6 月的全球 AI 頂會 CVPR 上進行分享。
昨天,小鵬又宣佈開啟自研 AI 晶片計劃,預計將在 2025 年底在中國內地率先實現 L3 級智慧駕駛落地。

未來,小鵬還希望透過雲端蒸餾小模型的方式將基模部署到車端,給「AI 汽車」配備全新的大腦。這款模型的能力同時也將拓展至小鵬的 AI 機器人、飛行汽車等。

© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]