

王軍擔綱聯席總裁、楊沐履新技術負責人,千里科技正在重寫AI時代的智駕正規化。
PART 1

千里智駕1.0“釋出即上車”
智駕產品路線圖首次公開

千里智駕1.0方案將最低標配100TOPS以上算力。其中,旗艦版方案搭載了高達700TOPS的行業頂級算力平臺,可實現多場景自主決策與複雜互動、車位到車位等核心功能。

今年3月,千里科技和吉利汽車集團基於深度技術合作,釋出了千里浩瀚智駕系統。其中,千里浩瀚 H3、H5、H7 對應於此次釋出的千里智駕1.0方案的三個版本。目前,千里智駕1.0解決方案已在客戶多款車型上搭載,真正實現了“釋出即上車”。
據雷峰網《新智駕》瞭解,千里智駕1.0方案將會在第三季度上車。第四季度,千里科技還將會向國家工信部申請L3的准入。
吉利是千里科技的大股東,而且千里科技也是率先與吉利共同釋出智駕方案。這樣緊密的合作關係不免讓外界產生一種疑問:雙方到底是一種什麼關係?
對此,王軍表示,吉利是千里科技的戰略合作伙伴,並不只為吉利服務,而是一個提供全棧式解決方案的Tier1公司。因為與吉利合作,所以雙方確定了千里浩瀚的方案名稱。對於其他客戶,千里同樣可以合作推出名為“千里A”方案、“千里B”方案。
千里科技將自己的智慧化戰略歸結為“一橫一縱”:橫向上,千里科技要做技術整合,集公司所有的產業資源,將各自獨立的感知、規控和執行模組整合為大模型驅動的全棧端到端方案;縱向上,要做產品整合,將感測器、控制器、執行器等產品整合為全套系統。
因此,這就不意味著千里科技要全棧自研軟硬體,而是選擇產業鏈裡最優秀、最好的產品,透過整體的解決方案給到客戶。王軍總結到,“千里科技的自身定位是“弱水三千,只取一瓢”,不會什麼都做,但是會做最關鍵,也是最終能給客戶帶來核心價值的一部分。 ”
加入千里科技前,王軍曾有很長一段時間在日韓等地工作的經驗,因此也見證了日韓等大型Tier1隨本國車企出海的案例。
據《新智駕》瞭解,在市場方面,今後千里科技還會與幾家國內客戶深度合作,同時也會積極拓展海外客戶。“海外是更廣闊的市場,我們作為一個零部件供應商,要跟隨中國車企逐步走向海外,做B端大客戶生意。”
PART 2

聯合研發千里智駕RLM大模型
多模態和強化學習正規化行業領先

正如上文所說,千里智駕的成立是在今年,而一個現實情況是智慧駕駛的發展已至下半場,地平線、華為、Momenta等方案供應商分佔了大部分市場。擺在千里科技面前的問題是:如何突圍,靠什麼去打動主機廠客戶?
王軍認為,雖然現在湧現出了很多的智駕技術方案,但是從智慧化走到AI化後,大家真正認可了“端到端+大模型”的發展方向。如果以這一方向為基準線,大家的轉型和儲備時間都不長,都在同一起跑線。
從2021年開始,作為曠視聯創的楊沐及其代表的團隊就投入大模型以及在自動駕駛領域落地的工作。楊沐表示,為什麼千里科技從2021年開始投入智駕的研發,也是因為原先的技術路線已經到了一個轉折期——從規則驅動開始走向資料驅動。
在這一轉型過程中,VLM是一個關鍵的技術節點,起到了承上啟下的作用。
最早的輔助駕駛採用模組化架構,由於感知、規劃及執行系統相對獨立,且每個步驟都要佔用一定的計算時間,整體系統的響應較慢,資訊也有損耗。
後來,在特斯拉的帶領下,端到端的概念興起,透過餵養“人類駕駛行為”可以應對大部分泛化場景,但仍然很難解決從未遇到過或特別複雜的問題,這時候就需要VLM的配合。
VLM就像是一個外掛,是車輛的“副駕駛教練”,透過影像識別和語義分析理解複雜交通場景,併為自動駕駛系統提供決策支援。
舉一個簡單的例子:早期並不在智駕主流圈的理想,正是在2024年透過“端到端+VLM”的技術組合成功躋身第一梯隊。這直接證明了在“AI+車”時代,原本的技術正規化與行業格局已經被打破,VLM成為下一個搶佔技術制高點的利器,這也是千里科技的核心競爭力所在。
千里科技的大模型合作伙伴是階躍星辰。經過聯合研發,千里科技基於階躍星辰行業一流的多模態基礎大模型底座、領先的強化學習正規化,推出了全新的千里智駕RLM大模型。
在楊沐看來,前沿的大模型具備極高的能力上限,透過與階躍星辰的深度技術合作,能將在大模型行業經過充分驗證的能力快速遷移至智駕領域,從而推動智駕大模型的研發落地。

千里智駕RLM大模型,全面覆蓋基礎大模型訓練、智駕資料特訓,以及強化學習三個密切相關的環節。
第一,在大模型預訓練階段,基於強大的多模態基礎大模型,海量的、跨領域的資料積累帶來了更好的資料生成能力,以及更強的通識性,從而大幅提升了智駕大模型的智力上限。
第二,在智駕資料特訓階段,利用駕駛場景的專用資料集,對基礎模型進行特訓和調優,以確保智駕系統能在車端較低算力條件下,仍能保持充分的泛化性。
第三,在強化學習階段,透過設定獎勵模型(reward model),降低對資料分佈的強依賴,抑制不良駕駛行為的出現機率,並進一步降低了兜底規則接管的頻率。
這三個環節就像是將一個兒童培養成“老司機”的過程:兒童具備認知世界的基礎能力,透過眼、耳、鼻等“多模態感測器”接收外界資訊;
第二個階段就是接受駕校教練的培訓,學習交通法規、路面標誌以及上路實踐,最終拿到駕照;
第三個階段就是上路實習,透過規避剮蹭、急剎等極端場景的能力提升,最終成為一個能應對各種情況的“老司機”。
這三個環節中,最難的仍然是最後一個。例如,如何解決系統壓實線的問題。有些團隊的傳統做法是將所有的上傳資料清洗一遍,刪除所有有壓線行為的資料,這種做法耗時費力,也顯得不AI。
千里智駕RLM大模型正是透過強化學習的方式,避免了上述方式的弊端,途徑是獎勵模型會提供更連續、泛化、更多維的獎勵資訊給到強化學習。簡而言之,告訴智駕“什麼是好的”,並以此讓系統儘可能接近這些表現。
這就有點類似於AlphaGo與AlphaZero,後者透過自我博弈和學習實現了比前者更強的泛化效能。另外,還有蔚來等車企透過設定“世界模型”,構建一個即時建模和反饋系統,幫助大模型突破過去“模仿學習”的窠臼,這也是一種可取的方法。
當然,從今年開始,業內正在推進VLA技術的落地應用。在一些業內人士的眼中,VLM是端到端1.0的一次技術最佳化,而真正的2.0換代升級是VLA。
與傳統的視覺語言模型VLM相比,VLA的優勢在於其不僅可以解析影像和文字資訊,還能實現類人推理與全域性理解。不過,VLA上車還面臨一些難點,比如車端算力不足,理想車端雙Orin-X晶片執行端到端+VLM算力已經比較吃緊。而VLA的模型結構更復雜,引數也會進一步擴大,對硬體算力和資料閉環的迭代能力要求就更高。
楊沐和王軍都認為,千里科技正在透過VLM去實現業界所需要的VLA功能。
事實上,業內的研究成果也正在沿著這一方向前進。
2025年1月,來自清華、伯克利分校和上海姚期智研究院的論文“Improving Vision-Language-Action Model with Online Reinforcement Learning”,已成功地將VLM透過使用專家機器人資料集進行監督微調(SFT) 整合到低階機器人控制中,從而產生視覺-語言-動作 (VLA) 模型。
除了基於強化學習的智駕大模型,千里科技還發布了新一代以 AI Agent 為核心的智慧座艙產品方案。該產品方案具備多模態融合的超自然互動、基於全融合地圖的人機共駕、第三生活空間,以及端雲一體的融合記憶等特性,旨在將座艙打造成一個“超級AI Agent”。
據王軍透露,千里科技將會在2025年Q4釋出新一代智慧座艙產品。
PART 3

雙線並行,積極卡位

從2025年開始,大規模普及的智駕浪潮將帶動新一輪市場洗牌,兩極分化的現象正在出現。
一類是向下的“智駕平權”類代表如比亞迪、吉利,將智駕成本捲到最低,強調覆蓋率;一類是向上的“智駕理想”代表如理想、小鵬,要做難度更高、更接近於人類決策流程的智駕系統。目前,理想已開始研發下一代VLA智駕大模型,目標在今年下半年實現專案落地。吉利汽車和元戎啟行也在積極推動VLA,各家都在比拼落地時間。
從這次釋出會可以看到,千里科技的智駕方案涵蓋了從低到高的各類智駕需求,並且在L3/L4的佈局上也正在積極卡位。
2023年,印奇曾判斷AI未來會沿兩大方向演進:一是AIinDigital,以 ChatGPT為代表的技術,給數字世界帶來新技術正規化的遷移;二是AIinPhysical,以特斯拉為代表的企業,將AI技術引擎與硬體載體結合,產生自動駕駛、機器人等不同型別的智慧機器,改造物理世界。



近期熱門文章



