上汽智己為什麼不打「智駕自研」的招牌?

用智駕供應商的方案,何必遮遮掩掩?
作者 | 郭瑞嬋
編輯 | 李雨晨
一直以來,走全棧自研路線的新勢力奪取了智駕的大部分聲量,但現在格局已有所鬆動。
“蔚小理華”之外,智己也開始越來越頻繁地在智駕測評榜單中出現。
今年9月,智己正式交付了全國都能開的無圖NOA,成為第四家達成這一里程碑的車企。一個月後,智己又正式推出了基於“一段式端到端大模型”的IM AD 3.0。
與這些玩家不同,智己的IM AD智駕系統是與Momenta聯合開發。一直以來,頭部車企對於採用供應商智駕方案的行為諱莫如深,即使是非自研也必須被包裝成全棧自研。但是智己和Momenta一直公開為對方站臺。
智己,是Momenta能夠在智駕行業扎穩腳根的關鍵一步。Momenta CEO曹旭東如此形容兩家之間的關係:“雖然是兩個公司,但勝似一個團隊。”
曹旭東表示,智駕的摩爾定律是兩年10倍,但智己與Momenta追求的目標要遠高於此,可能是兩年100倍甚至更高,實現這個目標,需要兩邊都具有高效的迭代效率,資料閉環效率的提升要從以月為單位加速到以周為單位、以一天為單位。
“放到任何一家公司內部,能夠達到這樣效率的團隊在行業內都是鳳毛麟角。”
透過聯合Momenta,智己宣佈將在年內獲得L4級無駕駛人道路測試牌照,成為全國首個同時具備L2+、L3、L4智慧駕駛量產能力的汽車品牌。
1

都在講端到端,智己與Momenta的有何不同?

IM AD 3.0的關鍵詞是“直覺”,這出自於行業里正在流行的“快慢系統”理論——人類大腦95%的決策都依賴於快系統,即直覺與條件反射,端到端智駕大模型則透過減少人為定義的規則以復刻人類大腦的快系統。

一段式端到端大模型,是目前復刻人類大腦快系統最極致的階段,透過把感知和規劃兩個模型整合成一個大模型,感測器原始資料輸入後直接就輸出規劃路徑,模擬人類的快速直覺反應。
它的優勢在於,無需人為定義從感知到規劃的介面,能學習全域性資訊與隱含資訊,就算面對看不清的道路結構與情況,也能綜合分析車流、行人的軌跡等全域性隱含資訊,基於全域性資訊輸出行駛軌跡,透過理解環境做到邊看邊開的老司機駕駛行為。
以路上的水坑為例,在過去的分段式模型中,水坑場景是比較難解決的Corner Case之一。首先需要人為定義水坑的型別,並用大量資料訓練感知模型以認知水坑,而在規劃模型中,也同樣需要大量躲避水坑的駕駛資料來訓練學習。
一段式端到端大模型去除了人為定義水坑的步驟,即使對水坑沒有顯性定義,也可以透過學習隱含的認知繞過水坑。由此可見,一段式端到端大模型的泛化能力更強、上限也更高。
同時為了保證下限,IM AD 3.0加入了“安全邏輯網路”進行兜底,負責對一段式端到端大模型生成的多模態候選軌跡做最終判斷,以確保直覺性決策的安全性。
端到端成為現實後,並非迎來了技術的終局,而是一個新的開始,算力與資料是未來競爭的核心。
特斯拉以雄厚的財力與資料優勢已經佔據競爭的高點,馬斯克曾表示,今年特斯拉投入到自動駕駛的訓練與推理的花費將超過100億美金。
自動駕駛端到端大模型的訓練試錯成本非常高昂,如何降低試錯成本是關鍵。
智己與Momenta提出了長、短期記憶結合的模式。這一模式仿照了人類記憶的形成過程,人在探索外界世界時,外界的資訊資料首先進入短期記憶,經過短期記憶的篩選驗證後,才會進入長期記憶習得能力與經驗。
長期記憶是一段式端到端大模型,短期記憶是DLP模型。後者是一個小版本,主要用於驗證方法以及訓練資料是否正確,實現演算法的快速迭代,做到平均一天迭代一個版本。被短期記憶驗證過的方法與資料,在積累一段時間以後,會應用到一段式端到端大模型上,基本保證一次訓練就能訓練得對、訓練得好,從而降低試錯成本。
“長短期記憶結合的模式是我們的一個秘密武器。”曹旭東介紹,這種模式比直接完全用端到端大模型去試錯,能減少10~100倍的訓練成本。
另外在資料層面,曹旭東提到,目前Momenta已經實現了百分百的資料驅動與演算法自動化迭代,擁有億級優勢資料的積累。到2027年,Momenta的資料積累預計突破1000億公里,徹底解決自動駕駛的終極長尾問題。
2

追趕與超越:供應商合作模式的範本

智己與Momenta能夠在此時追趕上業內的端到端熱潮,離不開最初的路線選擇。
早期的Momenta曾是“異類”,當同行們都在沿著Rule-based方法做智慧駕駛,Momenta從一開始就堅決押注資料驅動。
智駕技術路線向端到端收攏,須經歷三個階段,首先是感知的模型化,接著是規控的模型化,再下一步則是感知與規控的合二為一。
感知的模型化是業內共識,但是在規控的模型化上出現了分歧,基於傳統的Rule-based方法,只要投入的人力夠多,就以較快的速度取得不錯的規控效果。
不過,Rule-based始終受限於人力以及無法窮盡的Corner Case難題,當智駕開進城區裡,依靠Rule-based根本不可能大範圍開城。2020年,當各家都還困於高速NOA的開發量產時,Momenta就開始將資料驅動引入規控環節,試圖代替Rule-based。
曹旭東回憶,當時行業裡很多人都不認同這種做法,“這放到當時是有理由的,那時候用Deep Learning做Planning,在一些場景會有驚豔的表現,但是也會在很多場景裡出現匪夷所思的問題。
因此,規控的模型化其實是邁向端到端的一道高門檻,首先需要具備發現問題的能力,還要有分析、跟進並且解決問題的能力,這背後需要一整套研發體系的支撐。
Momenta與智己一同打磨了兩年多時間,到2023年4月,兩家才把資料驅動的規控做到量產,應用在高速NOA上。
當時,智己和Momenta召開了一場釋出會,釋出了命名為DLP的規控模型,但彼時業內對此並無太多認知。
“我們用Deep Learning做planning,位元斯拉還要更早,特斯拉今年上半年才上了端到端,Planning變成深度學習。”曹旭東說。
到了今年,在感知與規控都已實現資料驅動的基礎上,再加上背後持續進步的研發體系支撐,智己與Momenta將感知模型與規控模型合併成了一段式端到端大模型。
實際上,從正式開始推送高速NOA,到完成一段式端到端大模型的切換,智己與Momenta僅用了一年半的時間。
這一年半,智己與Momenta實現了從高速到城區,從高精地圖到輕圖,從Rule-based到端到端的切換。
在這些進展背後,是曹旭東所說的“勝似一個團隊”。
兩方的合作始於2020年末,也曾經歷過磨合期,從現在的結果看來,彼此互有成就。這4年時間,Momenta從智己那裡積累了從0到1的工程化經驗,得到了打磨產品與研發體系的機會,智己也憑藉Momenta的技術能力得到了競爭智駕第一梯隊的入場券。
從Momenta同學的角度來講,他不是在為一個某個客戶工作,我們也不會說,Momenta是我們的供應商,就用怎麼卡供應商、怎麼控制供應商的思維模式去工作。
智己智駕專案總監王康表示,現在IM AD智駕系統的開發與迭代都是兩個團隊一起去發現問題與解決問題,任何一個OTA的版本,都是雙方共同規劃與討論出來的結果,每週的設計變更也都是兩個團隊一起評估與驗證。
在供應商模式下,留給智己的考驗是,如何做出好的產品定義與產品特色。
跨域融合,是智己的一個突破方向。去年智己LS6上市時,智己就已推出了基於艙駕融合打造的全域數字視野補盲功能以及“雨夜模式”。
今年,基於靈蜥數字底盤,智己將智駕域與底盤域進行聯通與融合,以“雲臺車身控制”功能為例,依託智駕系統對環境的精準感知,能夠識別大麴率的彎道,對底盤進行智慧調整,提升駕乘的舒適度與平穩度。
另一方面,靈蜥數字底盤也賦能了智駕,四輪轉向功能帶來更小的轉彎半徑,智駕在調頭場景下更輕鬆,減少智駕體驗中斷的機率。
在智己看來,靈蜥數字底盤是智慧駕駛非常合適的載體。“智駕體驗是否讓使用者感到舒適,有沒有頓挫,都要有好的底盤來做‘手、腳、眼、腦’的協調工作,只有做到這樣,才能算是真正好用的智慧駕駛。”智己智駕中心總監賀錦鵬表示。
由智己官方提供的即時資料顯示,IM AD智駕系統的使用者黏性持續有所提升,前一週智己使用者在日常出行當中使用IM AD的比例為81.4%,而在過去一週中使用IM AD的使用者比例已達到95.65%。
去年開始,智己明確了以智慧車為品牌的賣點,如今智駕已經追趕上來,智己剩下要做的事情是如何把車賣好。


相關文章