智駕的DeepSeek時刻!城區NOA有望再降本30%?

DeepSeek的闖入,智慧駕駛或將醞釀新的變局。
2月初,吉利官宣自研大模型與DeepSeek深度融合,將透過DeepSeek R大模型的頂尖認知能力與吉利全域AI技術體系,重新定義智慧汽車的人機互動和智慧駕駛。
比亞迪宣佈整車智慧「璇璣架構」將接入 DeepSeek R1 大模型的能力,以快速提升車端和雲端的 AI 能力。
包括在智慧駕駛系統中,雲端 VLM 大模型利用 DeepSeek 的知識和推理能力,大幅提升自動化資料生成的效率和質量,解決更多長尾場景的瓶頸問題;在車端模型上,利用 DeepSeek 進一步強化知識蒸餾,讓視覺語言模型更好地在車端部署執行,做到車端、雲端同級智慧。
誠然,在DeepSeek的加持下,高階智駕將加速落地,同時能兼顧低成本和高效率,且在極端駕駛場景下的智駕表現能力更出色,有望縮短車企之間的智駕代差。
某種程度上看,類似於DeepSeek等通用模型賦能智駕,也是車企們不約而同喊出全民智駕的底氣之一。
總體上看,DeepSeek帶給智慧駕駛的影響,主要體現在駕駛體驗和成本兩個方面的最佳化。具體將從上游演算法、硬體、晶片、推理工程,再到決策規劃、感知、測試、模擬資料等等環節賦能。
比如,DeepSeek的部分小模型,如語義分割、目標識別等,可用於最佳化智駕供應商的現有模型,以達到更精細化、更高效,同時感知任務和運動規劃的真實標註成本將顯著下降。
知行科技方面表示,DeepSeek絕對利好自動駕駛,在效能表現和算力節約等方面有很大提升,尤其是在極端路況,包括極端場景的城市NOA能力會更加老練,對中等算力平臺智駕玩家而言是個好訊息
從技術角度來看,DeepSeek創新性地採用了混合專家架構(MoE),將深度學習模型劃分為多個子模組,每個子模組專注於不同任務的處理;透過群組相對策略最佳化(GRPO),使得各子模組在多工環境下能夠動態調整權重和引數分配,實現更高效的協同工作。
另外,透過引入多頭潛在注意力機制(MLA),DeepSeek在捕捉影像細節、多模態資訊關聯等方面更加敏感,應用至自動駕駛中,可賦能車輛對複雜路況和極端場景更強的適應能力。
據瞭解,知行科技在測試了325個影片,準確率達到97%(沒有DeepSeek是95%),如果全部資料都使用DeepSeek,最佳化效果更好。
在此背景下,即端到端、大模型技術賦能智駕提升研發效率,DeepSeek等中國技術創新為行業帶來“算力通縮”,技術降本潛力巨大。2月12日,知行科技宣佈了新一輪超2億元融資,將高效推進基於AI大模型的智駕研發能力升級
具體將透過加大對AI演算法、大模型、大資料、多模態融合、智慧即時決策系統及其他與AI驅動的自動駕駛相關領域的投入,以強化研發和生產製造能力、 吸引高階人才、尋求與領先的AI公司合作的機會以及增強未來的競爭力。
而從實際應用來看,如何透過蒸餾技術,將DeepSeek大模型核心構件重組並壓縮為中輕量化模型,部署在車端,將構成智慧駕駛公司核心護城河。
DeepSeek 的爆火,為 LLM、VLM/VLA 與自動駕駛行業的融合按下了加速鍵。魔視智慧 MOTOVIS 作為自動駕駛智駕方案供應商,在這一變革浪潮中,對 DeepSeek 和自動駕駛的結合有著深刻的理解與實踐。
在資料治理方面,魔視智慧 MOTOVIS 已率先運用多模態大語言模型,為資料探勘賦予了新的活力。借鑑 R1 的強化學習思路,推廣到 VLM-R1,同時微調 SFT 專有業務小規模大模型,並引入 TTS 等技術,使得多模態大模型能力得到了全方位提升,不僅在視覺和語言方面表現出色,還擴充套件到雷射點雲等領域,極大地提高了資料探勘標註的效率。
這一創新舉措在多模態資料對齊任務、以圖搜圖、文搜圖、圖片 / 影片理解、文生圖、文字 + 影像編輯、影像模擬變換、真值標籤生成以及世界模型生成影片和 3DGS 三維場景等任務上,均取得了顯著成效,為自動駕駛的感知層面構建了堅實的資料基礎。
在模型創新方面,魔視智慧 MOTOVIS 巧妙地結合了端側的端到端模型與優質的 VLM 底座模型,為其注入了強大的理解能力。在此基礎上,疊加 R1-ZERO 強化學習與思考鏈元素,進一步提升了 VLM 以及 VLA 的泛化性,使模型能夠更加靈活地應對複雜多變的路況。
此外,藉助 3DGS 技術大規模重建行泊場景,並將強化學習技術應用於這些重建場景中,對端到端模型進行額外的強化訓練,從而進一步增強了模型的泛化性和安全性,確保自動駕駛系統在實際道路中能夠穩定可靠地執行。
值得一提的是,DeepSeek V3 的混合專家架構(MoE)為車載端側模型壓縮和大模型端側部署效率的提升提供了新的思路。魔視智慧 MOTOVIS 的專利 CN112446439A(深度學習網路動態分支選擇)與 DeepSeek V3 的 MoE 理念高度契合,能夠有效應用於車載端側模型壓縮,加速大模型在端側的部署效率。這一技術的應用,將有助於 MOTOVIS 在保持模型效能的同時,降低計算成本,提高模型的部署效率,進一步提升其在自動駕駛領域的競爭力。
魔視智慧 MOTOVIS 始終保持敏銳的洞察力與快速的行動力,持續將 DeepSeek 等 AI 領域的前沿成果植入資料積累與模型應用,不斷最佳化智駕方案,致力於為使用者的自動駕駛之旅提供更安全、更智慧的體驗,在自動駕駛行業中展現出獨特的魅力與強勁的實力。
基於此,有行業專家表示,使用DeepSeek的強化學習方法,訓練集數量級會小很多,可以降低算力需求,算力使用預計能最佳化20%-30%。
有訊息顯示,大疆在高通8650平臺初步使用DeepSeek模型後,推理響應時間從20ms降至9-10ms,算力利用率從近乎100%降至65%。
這也意味著,DeepSeek城區NOA算力需求,或許有望降低至50-60 Tops,城市NOA方案成本則將降近30%至5000元左右(目前城區NOA算力大致100Tops,成本為7000元左右),可進一步助推智駕普及。
有報道指出,某車企在接入 DeepSeek 並採用國產晶片替代方案後,僅在晶片採購環節,每年成本就降低了約 40%。同時,由於 DeepSeek 對硬體算力需求的降低,車企在資料中心建設與運維方面的投入也大幅減少,預計每年可節省約30% 的相關成本。
除了降本空間繼續下探之外,中小算力智駕晶片的生命週期有望被延長,對這部分供應商而言,市場視窗期的關閉速度正在放緩。
而已經具備高性價比、高效能晶片量產能力的本土廠商,比如地平線、黑芝麻、愛芯元智等,搶跑DeepSeek智駕晶片市場機會非常明顯。
比如,黑芝麻專為多域融合、艙駕一體應用場景推出的高效能計算平臺武當C1200家族晶片,已經完成DeepSeek模型部署。另外,其華山A2000也將全面支援基於DeepSeek的多模態大模型。
接下來黑芝麻還將利用高效能晶片的算力優勢,探索DeepSeek在智駕領域的落地方向和應用場景。例如,更少的訓練成本、更強的邏輯推理能力等。
不過,業內普遍認為,智慧駕駛融合DeepSeek,功能下限仍然是現實挑戰。
畢竟,由於資訊輸入源和應用場景有較大差異,DeepSeek等通用模型在智駕領域的應用,並非直接接入上車就能完成。
如何在最高功能安全等級ASIL-D標準、低時延等要求下,安全穩定地實現知識的蒸餾、跨任務的泛化等,都是擺在業介面前的難題,因此DeepSeek智駕實際上車可能還需要較長的訓練時間。
而從現階段智駕供應商對DeepSeek的態度來看,由於各自的技術路線、架構選擇、技術理解和迭代路線不同,利用DeepSeek側重解決的問題也呈現出差異化。
比如,在端到端技術路線上積累較多的玩家,正基於強化學習訓練更好的感知、決策模型;以小模組為主的公司,則將DeepSeek放在模組中做架構整合;致力於實現決策和感知一段式端到端的供應商,可能下一步將整合上游V2X。
以端到端為例,自2024年以來,多家智駕Tier 1宣佈端到端技術路線,透過海量的高質量人類駕駛資料,實現最佳的學習模仿駕駛效果。瓶頸在於,基於模仿學習的技術正規化,難以突破人類能力上限,加上高質量資料稀缺,也令端到端智駕的競爭更聚焦算力、資料。
因此,DeepSeek基於純強化學習,賦能大模型自行湧現出長思維鏈能力,提升推理效果,或能突破端到端的上述難題。並且透過少量高質量資料的冷啟動,模型進行多階段的強化學習訓練,降低大模型訓練的資料規模門檻,有望彌補部分端到端的資料需求缺口。
比如,近期商湯科技釋出的行業首個「與世界模型協同互動的端到端自動駕駛路線 R-UniAD」,透過構建世界模型生成線上互動的模擬環境,進行端到端模型的強化學習訓練。
據商湯科技測算,小樣本多階段學習的技術路線,能讓端到端自動駕駛的資料需求降低一個數量級。但具體會下降多少,目前尚未有比較明確的答案。
DeepSeek賦能智駕究竟是“噱頭”還是“降本利器”?有待更多實踐檢驗。

相關文章