對話智己汽車智慧化團隊:跨入高階智駕第一梯隊,這個品牌做對了什麼?

頭圖來源 | 智己官方
作者 | 伍文靚
編輯 | 蘇鵬
「端到端」是今年智駕領域最火的話題。
近日,智己汽車聯合Momenta釋出了基於一段式端到端智駕模型打造的IM AD 3.0,讓汽車不光是擁有「人的直覺」,而且擁有「海量的好司機直覺」。
汽車擁有「直覺」,怎麼來理解?
Momenta CEO 曹旭東告訴我們,“有直覺”就是“車隨心動”,想到什麼,車就做了,而且非常絲滑。
目前,智己汽車和Momenta共同打造的端到端大模型暗合了人腦腦科學發展領域和趨勢。他們認為,人腦執行機理類似於經驗+預測大模型,跟一段式端到端基本理念相同——經驗是過往收集和用於訓練的海量優質資料,預測是端到端本身的輸出。
對映到智駕大模型之上,智己汽車的一段式端到端,感知和規控是完全打通的;同時控制橫向與縱向軌跡,在智慧性、舒適性、安全性上都能達到新的高度。
同時,智己汽車還提出創新的思考,透過“快系統”“慢系統”相互配合,透過模擬人腦用“直覺推理+邏輯分析”的方式正確處理問題。快系統即直覺推理,善於直覺與經驗快速處理問題,形成決策。
這一技術突破了感知模型的侷限性,實現了更加智慧的路徑規劃和駕駛決策,為使用者帶來更優異的使用體驗。
不難看出,智己汽車和Momenta是一段式端到端技術路線的忠實擁護者。事實上,市面上兩段式端到端的玩家也不少。
兩段式方案通常由感知模型和規控模型兩個部分組成,外部資訊的處理步驟是,經過感知模型過濾,再傳輸到規控模型進行計算和決策輸出。
對此,智己汽車也有一些思考。“關於一段式和兩端式路線,行業有各種各樣的解釋和定義。不管什麼樣的技術,最終目的是能夠擬人並超越人。”智己汽車智駕中心總監賀錦鵬說道。
為了實現「擬人並超越人」的最終目標,智己汽車的L2、L3、L4採取了共平臺開發策略,共享資料池和一段式端到端大模型,其中L2可以為更高階的智駕功能收集海量優質資料,而L4的技術迭代又能反哺L2/L3的使用者體驗。
經過過去多年的耕耘,智己汽車已成為全國首個同時具備L2、L3、L4智慧駕駛量產能力的品牌。智己IM AD 3.0也已開通全球無圖NOA的智駕體驗,躋身高階智駕第一梯隊。
關於這一成績背後的思考,我們與智己汽車、Momenta深入聊了聊。
以下為智己汽車CMO李微萌、Momenta CEO 曹旭東、智己汽車副CTO郭輝、智駕中心總監賀錦鵬、智駕專案總監王康等嘉賓接受未來汽車Daily在內的媒體問答實錄(有刪改):
Q1:IM AD如何透過一段式端到端大模型來生成“直覺”,和友商智駕方案的區別是什麼?
曹旭東:今年,端到端大模型概念很火。據我瞭解,行業裡端到端大模型是多條途徑,包括橫向、縱向,但一些所謂的端到端大模型,只輸出橫向,沒有縱向輸出。
我們的端到端是比較完整體的途徑:首先是一段式,感知和規控是完全打通的;其次,透過大模型對橫向與縱向軌跡進行很好的控制和最佳化,在智慧性、舒適性、安全性上都能達到更高的天花板水平。
Q2:我們有一個概念叫“從‘最像人’到‘有直覺’”,怎麼定義“最像人”還是“有直覺”?
曹旭東:“有直覺”就是“車隨心動”。當你看到一個場景,你覺得這個車應該那樣開的時候,它立刻馬上那樣開了,這就非常絲滑、非常直覺。
智己聯合Momenta打造的一段式端到端智駕大模型,不光是擁有“人的直覺”,更是擁有“海量的好司機直覺”。我們收集了海量資料,從中篩選好司機的駕駛行為(絕大部分被認可的駕駛行為習慣),並且對一些關鍵指標進行分析。比如,智駕系統的橫向避讓比人避讓的多還是少?比人加速的多還是少?最終基於海量的資料分佈以及好司機的駕駛行為指導智駕大模型學習。
Q3:智己的一段式端到端大模型實現機制是什麼樣的?
李微萌:一段式端到端的技術路線非常好。五六年前,大家還不覺得城市NOA會這麼快實現,更多專注於高速高架NOA研發。那時候有兩個技術流派:一個技術流派是rule-based,另一個就是我們和Momenta所堅定走的Data-Driven技術路線。
今天,為什麼有人是兩段式端到端,而我們直接做了一段式端到端?因為我們覺得一段式端到端一定是未來領先的技術路線。智駕到最後一定是像人一樣開車,人開車的時候不會先識別這是瓶子(還是其他障礙物),再做規劃。當年有人選擇rule-based,是因為它可以快速把場景做出來,變成汽車的賣點給到使用者。但是Data-Driven要的資料訓練量很大,一開始起步沒有那麼的快,需要不停的累計學習。但今天我們來看,當年選擇Data-Driven是對的,因為智駕一定會實現城區NOA,以及L3、L4也會實現。
曹旭東:我們和智己對於資料驅動特別有信仰,Transformer在2018年就出來了,到2020年已經用Transformer做Planning。那時候,行業裡很多人說用Planning做Planning,或者資料驅動做Planning,肯定是不太可能的。確實在不同的場景這個路線會有驚豔或匪夷所思的問題。
我們的研發團隊和智己打磨,到2023年初,才真正把Deep Learning Planning做到量產。現在回過去看,那時候我們做到的其實就相當於現在行業裡兩段式端到端,只不過那時候沒有流線的資料,開發難度更小。所以我們用Deep Learning做Planning位元斯拉更早,特斯拉今年上半年才上了端到端,Planning變成深度學習。而且我們在去年已實現兩段式,再加上研發體系的支撐,今年成功實現一段式端到端。一段式端到端的優點是天花板更高,缺點是研發難度更大,它需要很強的研發體系支撐才能做到。
賀錦鵬:基於兩段式端到端和一段式端到端,行業有各種各樣的解釋和定義。我們在2023年蘇州釋出會講過“認知智慧”和“感知智慧”同樣重要,基於這個前提,我們做了幾種Planning的Deep Learning,那時候沒有用兩段式端到端的名詞。現在行業所提到兩段式端到端,不管什麼樣的技術,最終目的是能夠擬人並超越人。
《新機器智慧》作者霍金斯被稱為腦科學領域的科技怪人,他提出人腦執行機理類似於經驗+預測大模型,跟我們當前所做的一段式端到端基本理念是一樣,經驗是做的訓練、大資料,海量的優質的資料,預測是端到端本身的輸出。不管對自己行為預測還是對周邊障礙物預期目標軌跡的輸出,也是完全暗合了人腦腦科學發展領域和趨勢。這是我們認為的“為什麼一段式端到端上限更高”,同時我們不排斥在有些模擬推理上工作內容也會疊加在端到端上。
Q4:智己端到端傳播點提到“快慢系統”、“短期記憶和長期記憶”,其他車企也提到過這些,智己的區別是什麼?
賀錦鵬:我認為現階段大家比的是對行業技術趨勢的理解以及資源投入。如何實現快速迭代,各家會有差異化。就行業趨勢而言,頭部幾家都在做一段式端到端大模型;難點是如何獲取海量、優質的資料,以及怎麼做快速迭代。在相同趨勢的基礎上,智己提出額外內容,透過“快系統”“慢系統”相互配合,透過模擬人腦用“直覺推理+邏輯分析”的方式正確處理問題。快系統即直覺推理,善於直覺與經驗快速處理問題,形成決策。這是我們認為有差異點的地方。後續我們也會和Momenta在增大雲端總體算力,增強大模型的快速產出的能力。
Q5:智己智駕選擇和Momenta合作,在成就一個好的智駕系統方面,雙方是怎樣的角色和配合,因為已經有新勢力表明全棧自研端到端非常有必要,想聽聽智己和Momenta的想法。
郭輝:智己與Momenta的合作堪稱行業典範,智駕領域強強聯合模式建立起領先優勢,把大家的優勢組合起來,轉化成最好的產品,給到使用者極致的體驗,這才是我們的終極目標。在整個合作過程中,Momenta基於深度學習、神經網路,以及資料方面的知識和能力,為智己帶來了非常大的幫助。從智己角度來講,我們在工程化方面的經驗,包括對整車的理解,包括怎麼能夠讓智駕系統在車上實現十萬輛乃至更大規模的技術落地,我們要做大量的工作,無論從整車層級的系統性開發,抑或是硬體和底軟相關的開發和驗證,以及到最後測試過程中如何做好資料閉環,這些都非常重要。
關於主機廠如何平衡與開發商的關係,整車企業要不要做全棧,行業裡有各種各樣的聲音。在早期的經典汽車時代,日本豐田、本田都是自研自造。後期,部分零配件自研團隊成為獨立的公司開始做零部件,我們現在講的汽車產業鏈和產業協同都是在這個時期形成。這就有點像三國時代,分分合合,分久必合,合久必分。我們認為,如何能夠快速迭代,達到市場預期,就是最好的方案。
曹旭東:智己和Momenta雖然是兩個公司,但是勝似一個團隊,整個合作迭代效率非常高。我們之前說智駕摩爾定律是兩年時間內體驗增加十倍,但是我們的追求是遠比這個要高,可能兩年一百倍甚至更快的速度。實現這個目標需要兩邊非常高的迭代效率,整個資料閉環的效率提升,可能從以月為單位加速到以周為單位,再以周為單位加速到天為單位,兩邊團隊透過多年的合作形成默契後,這個效率提升放在任何一家公司,內部的團隊能夠達到這樣的效率,都是非常鳳毛麟角的,只有這個行業最高階的一部分的企業能夠做到。
我們在2023年,花了八個月時間開通全國高速高架NOA;城市NOA 2024年初在上海首發,到9月底全新LS6上市開通全國無圖城市NOA,在這個過程中經歷過技術方案的切換,從原來的高精地圖方案切換成輕地圖或者無圖,這個技術方案的變更非常大,挑戰也非常大。從結果來看,雙方的合作達到了預期目標,也證明早期決策是非常正確的。
Q6:智己的技術目標是和競品之間是拉齊到第一梯隊,還是在產品和體驗上形成比較大的差異化?如何看待智己在研發速度上保持領先的身位,畢竟智己剛開始主打數字底盤標籤,現在又打智駕標籤,智己在產品定義上有哪些新的調整?
郭輝:第一,智慧化作為汽車下半場最重要的競爭要素,這一點大家不會有疑問。在智慧化賽道,核心抓手是智慧駕駛,可以認為它是技術底座。對於智己來講,我們的品牌優勢是靈蜥數字底盤。就以我們的“雲臺車身”為例,依託智駕系統對環境的精準感知,能夠識別大麴率的彎道,對底盤進行智慧調整,讓乘客獲得舒適平穩的駕乘體驗。這是典型的跨域融合的例子,數字底盤也會用到智駕感知能力,同時在人駕情況下提供舒適的駕駛體驗。這個例子說明了,我們可以把數字底盤和智慧駕駛的優勢融合在一起。當然,前提是我們的智駕技術要非常優秀,要在第一梯隊,要有突出的表現。
賀錦鵬:補充一下,比如我們有靈蜥數字底盤,在城市開啟高階智駕,遇到調頭工況時會用到靈蜥數字底盤的智慧四輪轉向,讓調頭更輕鬆,實現更小半徑的調頭,不用在雙向兩車道的道路上頻繁打方向,智駕體驗不會中斷。另外,我們根據攝像頭識別的彎道曲率資訊,控制雲臺車身,在道路有傾斜的狀態下,使車輛的駕乘體驗更加平穩。我們認為靈蜥數字底盤是智慧駕駛非常合適的載體,智駕體驗是否讓使用者感到舒適,有沒有頓挫、均要有好的底盤來做“手腳,眼、腦”的協調工作,只有做到這樣,才能算是真正好用的智慧駕駛。我們會用靈蜥數字底盤賦能智慧駕駛。
Q7:智慧駕駛已經被消費者納入購車決策,這個趨勢對智己的影響程度有多大?從營銷層面來講,智己現階段圍繞智駕做了什麼,接下來有什麼規劃?
王康:進入智慧電動車時代,我們對使用者的購車決策深有感觸。之前,使用者選擇車看外觀、造型、價格,電動車還看電耗;近兩年,使用者選車時,智慧化的權重越來越高,包括智艙智駕。
智己汽車在成立之初已經有了很清晰的思考,始終把智慧駕駛當做核心DNA對待。我們最近推出的新車型——智己L6、全新智己LS6都全系標配雷射雷達、Orin X晶片,拉齊硬體,讓所有使用者都能夠有機會擁有高階智駕體驗。我們在軟體演算法方面也有很多思考,比如,去年在蘇州釋出會上,我們第一次把Deep Learning Planning的Planning用到我們演算法中;在清華大學舉辦的IM AD技術釋出會上又有了新的想法;今天,我們採用一段式端到端智駕演算法更好的賦能智IM AD,給使用者更好體驗。我們覺得使用者對智慧化有更高期待,反過來給我們更大動力為使用者提供更好的智慧化產品。
李微萌:現在營銷端分兩塊,一塊是“傳播”,有一種量變到質變的感覺,這得益於IM AD3.0的升級。以前,大家在聊智慧駕駛的時候“在商言商”,把媒體邀請過來大家試駕出一些內容;但是這次的IM AD3.0新版本,媒體和使用者都開始自發傳播,讓我真的是感受到已經是行業第一梯隊的水平。我們和友商也在互相學習,例如,透過相互測試來進行技術迭代。我們往前走到了一段式端到端大模型之後,也將會推動整個市場向前邁一步。
在銷售層面,有一些使用者MOT的場景,例如智駕+靈蜥數字底盤實現的一把調頭,讓用互非常滿意。試駕的時候,使用者就是要一些MOT點,這可能成為他給朋友介紹這臺車的時候炫耀點。另外,這次全國開通無圖NOA,也對助推銷量有很大的提升。 
Q8:去年郭總說過智己用兩年時間走過了友商九年的智駕路,躋身行業第一梯隊。除了和Momenta的合作因素之外,還有其他重要的因素推進智己的智駕程序嗎?
郭輝:從智己的角度來看,我們搭建的是全級別的智駕平臺,支撐IM AD的智駕系統快速迭代。所以我們從一開始就選擇了資料驅動這一條路。我們的L2、L3、L4採取了共平臺開發策略,共享資料池和一段式端到端大模型。我們也是全國首個同時具備L2、L3、L4智慧駕駛量產能力的品牌。在這個基礎上,我們提供好的平臺和好的架構,讓高價值的演算法和資料能夠在資料飛輪上快速的迭代,如此我們才能有機會藉助L2++的資料和規模優勢,打造L3和L4高級別自動駕駛的體驗,這是我們團隊合作的重要基礎。
Q9:同時開發L2、L3、L4,內部怎麼分工?另外,也有人說L2做得越好,L4就越遠,這種觀點怎麼看?
郭輝:我們的理解是從L2到L3、L4,在技術上有相同的部分,也有不同的部分。我們前面一直在講技術相通的部分,但在硬體架構上、演算法和安全上,完全可以做增量,我們對此有著非常清晰的路徑。
曹旭東:補充一點,有一個說法L2++做得越好,距離L4越遠,完全是偽概念。這個偽概念是曾經一小部分L4公司為了增加自己的所謂技術壁壘創造出來的概念,已經被證偽了。現在說的人已經不多了,甚至做L4的公司不好意思提這個說法了。
Q10:現在智慧駕駛賽道的玩家很多,智己在推動國家統一智駕標準方面有什麼想法和貢獻?
王康:隨著IM AD在自動駕駛行業裡分量和地位不斷提升,影響力不斷擴大。很多國家相關部門、國家級檢測機構均跟我們進行了高頻交流,包括去年L3准入等行業標準的起草,我們都有深度參與。我們不僅要聚焦產品,同時也希望為中國自動駕駛不斷向前發展,多做點貢獻。
賀錦鵬:我們會更加關注高階智慧駕駛,智己幾乎是所有高階智慧駕駛領域的行業標準參與單位。
Q11:智己LS6上市一個月表現怎麼樣?市場反饋和訂單量怎麼樣?
李微萌:訂單超三萬多。這個月交付量會達到八千左右,下個月破萬。
Q12:特斯拉Model Y要改款了,你們有什麼想法?
李微萌:中國品牌合圍Model Y,從10月的交付量來看,我還是很期待的。合力把它拉下神壇,肯定是中國品牌最開心的事情。中國品牌各自把自己的看家本領拿出來,互相促進變得更好,讓消費者有更大的獲益。
親愛的讀者們,不設定星標,很容易錯過我們的推送,也無法看到封面圖片。請星標“未來汽車Daily”,及時接收每篇推文,期待為您帶來更多更專業的行業報道。

相關文章