

“在全國做高階智駕的廠商裡,還沒有看到哪家用4個月把高階智駕從頭做到量產。”
作者 | 郭瑞嬋
編輯 | 李雨晨
今年,從決策到量產交付搭載自研智駕方案的新款極氪001,極氪只用了4個月時間。
脫離之前的Mobileye方案,極氪自研的浩瀚智駕方案採用了全新的感測器和計算平臺。老款車型換代時,把這套軟硬體裝上車,要做的改動並不少。
“在全國做高階智駕的廠商裡,還沒有看到哪家用4個月把高階智駕從頭做到量產。”
極氪副總裁、智慧駕駛負責人陳奇已經習慣打這種高強度的攻堅戰,極氪的智駕自研起步較晚,途中還有很大一部分精力投入到原來的Mobileye方案,跑步追趕是他和團隊的日常。
陳奇曾被稱為“華為自動駕駛”的第一人,2021年下半年加入極氪,這個時間點不算有利。因為在2021年初,小鵬已經推出了覆蓋全國範圍的高速NOA。在爭分奪秒的智駕卡位期,留給他做出自研成果的時間並不多。
入職的前兩年,陳奇先用大半年時間搭建團隊和開發體系,再用一年多的時間做研發,完成量產框架的從0到1。而跑通第一次量產,又花了近半年時間。
去年末,007正式上市,極氪有了第一批搭載自研智駕方案的車型。當時,極氪交付的智駕功能還僅限於高速NOA,在城市裡只有LCC和泊車功能。
今年8月,極氪推送了面向全國的城市通勤功能;10月末,極氪開啟採用端到端架構的無圖城市NZP的全國公測。從第一款自研車型上市,再到今天量產無圖端到端大模型,極氪只用了10個月時間。
極氪的無圖端到端架構吸納了行業流行的框架,即端到端+多模態大語言模型的快慢系統組合。極氪的端到端大模型現階段為兩段式,感知模型與規控模型透過顯示和隱式連線,實現反向傳播、連續可導;其多模態大語言模型則命名為MLM。
這個架構以外,極氪還提出了彙集人駕經驗、人駕軌跡以及時空環境等先驗資訊的數字先覺網路。
極氪認為,如果把端到端大模型比作人的大腦,多模態大語言模型比作人的小腦,大腦+小腦的組合還不足以還原完整的人腦,所缺失的部分是海馬體,也就是將重要資訊轉化成長期記憶的功能區。
數字先覺網路承擔著海馬體的角色,原理與記憶行車功能相似,車輛在行駛中不斷採集、沉澱自車資料與環境資訊,形成經驗資訊,為端到端大模型與多模態大語言模型的決策提供參考與指導,實現從新手司機向經驗豐富的本地老司機進化。
在極氪看來,端到端+多模態大語言模型+數字先覺網路的組合,才是面向未來3到5年的完整演算法架構,預計行業的技術路線會逐漸向這個方向靠攏。

陳奇的團隊成員中,有不少智駕經驗豐富的專家。
他們自稱是“國內最先做城區智駕的一批人”,其中一些人從12年前就開始接觸智駕,清楚智駕在城區裡面臨的問題和挑戰。
極氪成立至今,受到的最大質疑都來自於智慧化,對於陳奇的團隊而言,追趕也是為了“爭一口氣”。
一位極氪智駕自研團隊的早期成員告訴雷峰網《新智駕》,團隊的工作強度大、節點激進,但是極氪也有“佛系”的一面,“佛系”體現在沒有盲目跟從友商的節奏,之前都是埋頭在幹,宣傳很少,“不跟大家爭,不跟大家搶,全按自己的計劃和節奏來”。
三年時間,極氪打造了一個從硬體、底軟、中介軟體、演算法、應用到資料平臺、工具鏈均為全棧自研的智駕體系。
在吉利集團走向整合、協同的趨勢下,極氪的高階智駕將面向整個集團進行輸出,已有品牌正在協商使用極氪的智駕方案。
雷峰網《新智駕》近日參與了極氪舉辦的兩場溝通會,與陳奇、極氪自動駕駛運營部部長顧志強進行了一次對話,《新智駕》對此進行了不改變原意的編輯和整理。
Q:極氪從什麼時候開始做端到端?
陳奇:有幾個博士很早就開始研究,最近重點發力,追得快不是因為技術簡單,而是我們原來的架構設計已經有往這個方向做考慮。
Q:極氪推出的無圖NZP直接就採用端到端架構,中間是不是跳過了一些步驟?此前小鵬、理想都曾表示,智駕的迭代可以加速,但是不能跳過。
陳奇:自動駕駛沒有銀彈,無法用一種方法解決所有問題,要有很多工程上的積累與沉澱。到現在為止,如果連基於BEV+Transformer的高速(NOA)都沒做成,直接跳到端到端大模型,很難跳得過去。
行業經歷了很多次技術路線變更,從機器視覺到深度學習,後來是BEV+Transformer架構,開進城市裡,先依靠高精地圖,再步入輕圖,現在經歷到無圖跟端到端。
我們比他們少經歷的是重圖跟輕圖兩個步驟,我們直接做了城市通勤模式,以及現在的無圖端到端,將來會把通勤模式跟無圖端到端結合到一起。
Q:怎麼理解通勤模式跟無圖端到端的結合?
陳奇:通勤模式包含了一部分數字先覺網路的資訊,比如在通勤模式下走一圈,記錄時空環境資訊,包括道路的豁口,或者是商場和醫院門口那些比較繁忙的路口。早期,可以透過這些時空環境資訊為端到端賦能,在這些地方做更最佳化的處理。最後,這些智駕經驗融合成一個模型,逐步透過模型輸出(指令),解決道路情況等線性資訊。
我們會先把通勤和無圖端到端都做到極致後,再做這兩種模式的結合。如果先把輕圖和先覺網路放進演算法裡,會過度依賴於先覺網路,那無圖的泛化能力可能做得沒那麼好。
數字先覺網路與端到端結合,輸出端的軌跡數量增多,要在這些軌跡裡選出最優的解,目前對規控人員其實是一個很大的挑戰。很多人提到,端到端以後做規控的人是不是不需要了?端到端大模型是不可解釋的,原來做規則的人最知道端到端出來的哪些資料是正確的,還是要由這些人對出來的軌跡和控制資訊做評價。
評價的維度包括效率、安全性和舒適性,要在這些維度裡確定哪一條才是最優的軌跡,這對於規控工程師的要求更高了。怎麼評價這些軌跡是個很關鍵的話題,但現在大家都沒提。
Q:數字先覺網路對規避端到端“下限低”,有多大作用?
陳奇:可以打個比方,例如前面有個坑,不管是深坑、淺坑還是人為畫的坑,立馬做出反應的是端到端網路。
會去思考並根據坑的深淺來做反應,是MLM大模型。
數字先覺網路是發現大家都在這個地方繞路,或者使用者以前已經開過這條路,知道這個地方有個坑,提前預判和變道。
就像扁鵲三兄弟治病,扁鵲大哥治未病,扁鵲二哥治小病,扁鵲治大病,數字先覺網路類似扁鵲大哥,在事情沒發生前,就做了預防性的動作,讓智駕更安全、省心。
Q:數字先覺網路把不同車主收集到的資料都上傳到雲端,再共享給其他車主,是這種形式嗎?
陳奇:初步是這種形式,後面也可以做到千人千面。城市通勤模式是根據個人來的,現在要把數字先覺網路覆蓋得比較廣,會先做一版通用的,就像端到端一樣,現在先做通用,再根據地域做個性化的東西。
顧志強:數字先覺網路裡面有兩部分,一部分是先覺資訊,還有一部分是把人的開車經驗放到模型訓練之後沉澱成肌肉記憶。
放武漢的駕駛資料進去,開起來就和北京、上海的不一樣,因為每個地域的開車風格不一樣。模型綜合訓練後,會包含各地的駕駛風格。
將來的終極形態,可能是在武漢的時候,就把武漢的駕駛風格調出來,達到入鄉隨俗,開車風格不突兀。當然這可能還要走一些路才能實現,但會往這個方向去發展。
更終極的就像大白(陳奇)說的,能做到千人千面,相當於把自己學的經驗直接在本地應用了。
Q:總體來說,極氪做端到端有什麼優勢?極氪本來資料積累並不多,今年能把端到端做上車,靠的是什麼?
陳奇:資料上面也不算少,已經有大幾萬臺車在全國各地跑,今年8月以後,極氪每月的交付量都在2萬臺以上。
端到端一方面靠資料量,另一方面得靠有效資料量,關鍵是怎麼把有效資料選出來,這很考驗技術。2015、2016年,很多車企都說資料量很多,但實際上資料的重複度非常高,有效資料量不夠。
另外除了有效的資料,端到端還需要好的資料配比。如果這方面做得好,速度就能快很多。有好多智駕團隊號稱請了國賓司機,按照他們的開車習慣做資料訓練,但實際上可以從量產的資料裡,把類似於國賓司機的駕駛風格篩選出來,這是要花精力、花代價的,但資料量可以做得很大。
端到端後,智駕系統也會出現不穩定的情況,有時進步,有時退化,只有把整套智慧駕駛的資料閉環了,資料篩選、清洗和後端評測體系構建完全,才能真正發揮作用。
Q:極氪切換到端到端架構,做了哪些組織架構上的調整?
陳奇:組織架構上,端到端從感知、預測到規控都是一個團隊,效率最高,無論是物理的實體組織,還是虛擬組織,只要能把這個團隊高效運作起來就行。
第一時間,我們把感知、規控全拉通了,整合成一個虛擬化的團隊,有專門的人設計方案、盯方案,資料和訓練整個團隊都在一起。
剛開始的磨合期,團隊所有人都聚到一個辦公地點進行封閉開發,一起辦公、一起吃飯,等到能分解各個模組,或者成員弄清楚自己的任務後,再回到原位。
Q:現在我們的預研團隊會研究什麼方向?
陳奇:都會看,我們的多模態大語言模型還比較初級,需要繼續研究;現在行業裡已經開始用ChatGPT做智駕模型,我們也在探索這個方向。另外,數字先覺網路也還有很多可以挖掘的地方,我們同步在研究。
Q:端到端以後,我們會有一個預想的團隊規模嗎?
陳奇:團隊跟平臺、車型有關係。每個車型都需要除錯後再上車,比如001跟007的轉向就有很大不同,所以每個車型都需要一部分除錯、測試的人。
我們現在還是往前趕的階段,今年我們上了新款001、007,還有7X和MIX,後面也還有很多款在研的車型,要承接的車型很多,壓力不小。集團協同以後,車型也會更多,所以現在還無法給出精確的預測。
不過,我們團隊的戰鬥力很強。以2025款極氪001為例,前後也就花了四個月時間,這還是在更換了智駕硬體、工作量特別大的情況下實現的。在全國做高階智駕的廠商裡,還沒有看到哪家用四個月把高階智駕從頭做到量產。
Q:現在無圖NZP的公測時間提前了兩個月,年底要全量推送,25年初又要推door to door,實現這樣一個目標會有壓力嗎?
陳奇:壓力肯定很大,很多時候都是沒日沒夜地做,我們每次都會選一個城市,駐紮在那裡解決問題。今年推城市通勤,就選擇在武漢、廣州攻堅。
為什麼選擇這兩座城市?
去年底要量產007的時候,正好是廣州車展,想著要量產了就先做個試驗,從上海開到了廣州,另外還有一幫兄弟往西部開,經過武漢。高速上一路的表現還行,只有一點小問題。當時在城區裡,LCC還是主打功能,比拼十字路口能不能過、十字路口能過多長這些指標。
我們發現,廣州和武漢的城區表現得一塌糊塗,所以在廣州、武漢攻堅了大概一、兩個月。這樣下來,我們的LCC絕對是行業頂流,只不過是NZP起來之後LCC就不太有人用了。
2025款001的交付時間比較短,也有一段攻堅戰。去年007上市之後,第一代產品有問題要修復,後來我們要攻克“指尖車位(指尖泊車、立體車位)”,做城市通勤,這些都佔用了我們很多資源。
雖然通勤和無圖對比行業來講要稍微晚一點,但是效率很高,我們的推送也一再往前提。
能做到這點,是因為我們整個架構搭得不錯。在剛設計的時候,我們考慮了架構的可擴充套件性和演進性,所以能很快切換到無圖端到端,這是我們的優勢之一。
另一方面是,兄弟們也比較願意付出,帶有一些夢想,很希望能做到行業裡面的No.1, 所以也都憋著一口氣在拼。
如果能只做一款車那就太爽了,我很羨慕以前的蔚小理能有很長時間的技術積累期,前期可以用一兩款車來打磨團隊和產品,我們基本一路都在跑步追趕。
團隊裡還有Mobileye的方案,我現在還有很多精力都在那頭。極氪和安總對使用者都非常負責,不管怎麼樣,安總都要求我一定要把每套方案都做好。
Q:回顧加入極氪的三年時間,你會怎麼劃分極氪智駕自研的不同階段?
陳奇:前面一年都在搭團隊和構建基礎的研發能力。
主機廠的軟體研發能力比起原來網際網路或者高科技行業還是相對薄弱一點,團隊和軟硬體開發體系的搭建花了半年多時間,到了2022年3月左右,團隊的核心骨架已經搭成,也有了智駕最小的原型。
第二階段是正常研發的階段,花費了一年多一點的時間,到2023年6、7月份,整套量產的框架基本成型,資料平臺、工具鏈也都有雛形了。
我們真的是從零開始,我們原來搭載Mobileye方案的車型資料,因為感測器的格式不同,沒辦法通用。
從2023年下半年開始,就是各種量產的攻堅。
所以從2021年到2022年3月份,完成了團隊的從0到1;到2023年年中,完成了量產框架的從0到1;到2023年底007上市,完成了量產從0到1的過程;這之後開始多車型適配、量產車型維護和新功能迭代。
今年8月推送城市通勤,也算是有個初步成果。緊接著10月份公測無圖城市NZP,開始了進階城區的階段。
Q:你覺得自研步入正軌是什麼時候?
陳奇:2022年5、6月已經步入正軌。
我們團隊裡有很大一部分人已經做了很長時間的智駕,有些從2011年、2012年就開始接觸了。
我和我們團隊裡很多人也都經歷過大的產品洗禮,都做過上千人甚至是幾千人合作開發、程式碼行數達到千萬量級的產品。
如果沒有這些經歷,很多體系搭不起來。我們現在的研發體系比較健全。
我經常跟安總說,我們幫公司做好一個產品不算牛逼。行業裡面有這樣的例子,雖然已經做出了產品,但主力離職以後,沒人能接起來,對公司造成很大損失。
關鍵是要把技術、知識沉澱到組織里,這一塊我們做得相當好,我們從需求到設計到開發到測試到售後,甚至到使用者運營,整套鏈路都在同一個平臺裡,雙向可追溯。
Q:極氪做智駕的風格是怎樣的?
陳奇:我們起步較晚,人數不多,方向不能走錯。極氪智駕的執行力很強,團隊敢想敢拼敢幹,另外在技術上我們也會同時探索多個方向。
顧志強:我們一開始就花了比較多時間去思考架構,現在的架構想的比較清楚,保證每一份研發投入都不會繞彎路。
我們通勤也發,無圖也發,業界做這兩個模式的除了極氪,還有另一家頭部車企,但他們家不是像我們這麼思考的,我們將來要將這兩個產品形態進行融合。
Q:極氪一邊做城市通勤,一邊做端到端,一邊還在做車型適配,分散了不少精力,對研發體系的考驗有多大?
陳奇:整個架構我們做過設計。端到端跟無圖,如果當成兩件事情來做,人力吃緊。端到端跟無圖可以作為一件事情來考慮,端到端只是無圖的一種技術而已,也不一定要一下就過渡到One Model,可以先用兩個模型把端到端做起來。
像通勤、規則那部分,完全可以用來做我的兜底,做我的評價,跟無圖結合。你把這些做成一件事情,人力消耗上就會小很多,不會因為同時開展幾件事情導致人力翻倍。
Q:極氪的智駕會把誰當做借鑑物件?
陳奇:我們覺得好的,都學。每家都有比較好的地方,也有不好的地方,有些場景,我們做得更好。
現在無圖城區智駕,每家都還有很多問題,誰排老大、誰排老二沒有明晰標準,激進的版本會讓使用者不夠安心,慢慢開,反而安心感更足。
所以,第一個無圖城市NZP版本,我們考慮得就稍微保守一點。
Q:今年端到端的上車速度整體超過預期,你會覺得這裡面有被激烈競爭所裹挾的成分嗎?
陳奇:整體速度的確超預期,能有這麼快的速度,也是因為大家敢想敢拼,公司對智駕這邊的資源相當傾斜。
行業捲起來,或多或少都有被裹挾的成分存在,沒有哪家不被這個大趨勢推著走。
但在浪潮之巔搏一把,也是對人生最好的回報。連被裹挾的機會都沒有,才叫行業的悲哀。
往回推兩年,對現在的城區智駕都不敢想象,原來花兩年時間也做不到這個程度。智駕一向是最難的難題,還是需要大家一起熱火朝天往前推。
Q:現在市場有不同智駕技術路徑,極氪保留了雷射雷達,但也有廠商推崇純視覺,你們對不同路徑的安全性、成本有哪些看法?哪一條技術路徑最終會勝出?
陳奇:無圖技術和是不是純視覺不矛盾,極氪如果把雷射雷達去掉,表現也會很好。有圖無圖、帶不帶雷射雷達,不是技術路線之爭,關鍵是如何考慮使用者安全。
在沒有大資料訓練過的場景下,如夜晚或極端天氣,雷射雷達的表現優於所有感測器,一束光發出去直接回波,甚至可以感知到異形石頭。有了雷射雷達,很多極端場景會處理得更好。
林金文(極氪副總裁):在極端場景裡,沒有雷射雷達,對高階智駕的安全性保證是不足的。絕大部分廠家,包括華為這種智駕Top級廠家的高階車型都是帶雷射雷達版本,無論是頭部、尾部汽車企業,都支援高階車型搭載雷射雷達。
雷射雷達很昂貴,但實現的功能和安全性同樣不可替代。極氪堅持搭雷射雷達,基本絕大部分車型都是標配。
很多降價降到20萬及20萬以下的品牌,BOM成本沒有能力承載雷射雷達這樣的高階硬體,來實現更高階的智駕。極氪面對高階豪華市場,不會把價格打得很低,同樣不參與價格戰,像001,三年前價格是26萬多,今天基礎版也是26萬多,不像一些品牌價格降得非常厲害,幾乎降50%以上,極氪還是堅守價格底線。
Q:極氪後面所有的車型都要上浩瀚智駕嗎?會延續全系標配的方式嗎?
陳奇:至少現階段所有的產品是這樣,但是後面還是要根據產品的定位和節奏來。
Q:那極氪現在全系標配的考慮是什麼?
陳奇:作為一個高階豪華電動品牌,用料肯定要足。智駕是一個智慧化部件,也要為三、五年以後的更新和迭代、功能演進考慮,至少那時候不會那麼捉襟見肘,讓很好的功能用不起來。
Q:全系標配,其實很大程度是把智駕也免費送給了使用者,涉及到智駕商業模式的問題。瞭解到極氪內部正在探討一些智駕服務,用運營來收費,你們對此的思考是什麼?
陳奇:運營模式收不收費,還是要看市場來定。我們的確有這方面的思考。如果智駕體驗達到一定程度,將來就要做各種各樣的服務,包括推薦或者引導服務。
比如到服務區裡,直接引導車輛到充電樁裡充電,甚至車主可以提前下車,又或者是推薦餐廳,車主直接點一點,就能直接送到餐廳車位。如果將來粘性做好了,有可能會是一種可以收費的模式。
我們儘量把這種服務做好,會形成車主的習慣,極氪車用慣了,用其他車就不習慣,很多為個人量身打造的服務在其他車上找不著,那麼下一輛車還會優先買極氪。
Q:安總這三年來對智駕的態度有過變化嗎?
陳奇:安總一直對我們很支援、很信任,我們自己本身也比較拼,很希望把體驗打磨好。安總很多時候為我們考慮,儘量創造環境讓我們專注工作,他的評判標準很簡單,就看使用者體驗好不好。
Q:安總今年給你定的目標完成了嗎?
陳奇:根據產品線節奏,基本上我們都守住了。
老款001由於還沒有走到無圖的方向,後面開城還需要一定時間。現在我們也想快一點,前段時間我們研發的工程師和總監都想去以色列一起調,但是現在戰火紛飛,整個進度還是會受到局勢的影響。
我們肯定還是會持續不斷地最佳化,包括泊車、城市都在趕,加緊驗證,希望能早點給大家推出來。
Q:極氪和領克進行整合,極氪智駕如何反哺其他品牌?
陳奇:現階段我們整個團隊還是聚焦於極氪自身,希望把最好的技術還有功能都應用到極氪的車型上。
對外方面,要根據集團的協同、資源的整合。合適的時候,極氪智駕肯定也會考慮開放給兄弟品牌,有一定的發展動態,我們會第一時間告訴大家。
Q:極氪的智駕方案分享給兄弟品牌,會不會區別對待,比如降低硬體配置?
陳奇:我們儲備的方案肯定不只有一個高階的,有一些其他的方案,會根據產品定位和品牌定位進行選擇。
現在有一個趨勢,越來越多十多萬的產品也用上了高階智駕,比如雙OrinX晶片或OrinX晶片+4D毫米波+雷射的情況,還是要根據市場的情況以及車型的定位來決定。




