作者:李寧遠
上週DeepSeek釋出了一篇關於NSA的技術論文報告,這是一種硬體對齊且原生可訓練的稀疏注意力機制,用於超快速長上下文訓練與推理。DeepSeek表示該機制可最佳化現代硬體設計,加速推理同時降低預訓練成本,並且不犧牲效能。
DeepSeek與硬體協同發展帶動硬體裝置升級與市場增長是資本市場概念熱潮褪去之後,下一階段落地到實體產業的發展關鍵。從不同終端硬體的技術發展來看也的確如此,終端裝置正在經歷新一輪的升級迭代,終端硬體廠商與DeepSeek的緊密合作正推動硬體裝置向更智慧、更高效的水平邁進。
終端硬體裝置最具科技想象空間的無疑是機器人,今年尖端AI推理模型DeepSeek帶來的高質量小模型和多模態推理模型方面的創新,正在為機器人的商用應用和終端側推理落地做好準備,強大的模型能力已演進到一定程度能在終端側賦能硬體。宇樹科技CEO王興興近日也表示,在今年年底之前,整個AI人形機器人會達到一個新的量級。
從人形機器人的發展史上來看國內產業鏈很長時間都處於下風,但近年來這一態勢已發生逆轉,憑藉深厚的技術積累和強大的供應鏈體系,國內企業在關節伺服、運動控制等傳統機器人技術領域取得顯著突破,而後趁著AI浪潮國內企業在硬體技術成熟度提升與模型賦能的雙重驅動下迅速崛起。
金融機構摩根士丹利最新發布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》(人形機器人 100:繪製人形機器人價值鏈圖譜)報告中羅列的全球人形機器人產業鏈上市公司百強名單中,亞洲公司佔據73%其中中國公司佔56%,還有77%的整合商來自亞洲其中45%來自中國。過去5年中人形機器人專利申請數中國以5688項遠超美國和日本,雄踞第一寶座。報告預計,到2030年,中國人形機器人市場規模將達到120億元人民幣,銷量達150萬臺;到2050年,中國的人形機器人市場規模將達到6萬億元,人形機器人總量達到 5900萬臺。
The Humanoid 100中的國產供應鏈,端側智慧引領機器人發展
報告中將供應商分為三類,分別是負責半導體和模型軟體的“大腦”供應商、負責工業元件的“身體”供應商以及負責整機制造的“整合商”。
在“大腦”供應商部分,上榜的中國企業有百度、地平線機器人和臺積電;“身體”供應商部分,中國企業有旭升集團、億緯鋰能、寧德時代、雙林股份、拓普集團、三花智控、匯川技術、綠的諧波、雙環傳動、中大力德、雷賽智慧、埃斯頓、兆威機電、鳴志電器、金力永磁、北方稀土、北特科技、恆立液壓、韋爾股份、柯力感測、速騰聚創;整合商部分有廣汽集團、小鵬汽車、比亞迪、小米集團、阿里巴巴、騰訊、埃斯頓、優必選、美的集團。

作為在晶片類別唯一一家上榜的國內SoC廠商,地平線在邊緣側端側的AI SoC實力有目共睹,“地平線機器人”其創立設定的場景便是機器人、自動駕駛這樣需要即時完成計算的端側場景,其SoC產品所有的軟硬體架構都為端側的特殊需求設計。在硬體上,地平線打造的智慧計算架構BPU,不僅是算力和功耗的最佳化,還將感知、規控等各種任務統一到Transformer框架下,更好支撐模型帶來的新能力。DeepSeeK問世後地平線宣佈支援DeepSeeK大模型,透過端側高效推理能力,幫助端側裝置在訓練智慧系統時,降低資料訓練成本,提升訓練效率。
“身體”供應商部分國產供應鏈覆蓋了關鍵零部件全鏈條,從電機到感測器,再到精密結構件。電機領域明確的發展趨勢是電機智慧化和高效節能化,在電機晶片領域,SoC級的解決方案並且具備更強的邊緣側計算和智慧決策能力成為了下游市場的期許。所以現在眾多電機主控晶片都會配置DSP或者NPU來實現計算加速元件,讓主控能夠在端側執行AI演算法智慧最佳化能效並增強終端裝置的響應速度。
感測器是機器人核心部件,人形機器人具身智慧時代,端側感測器與AI的結合絕對已經成為必不可少的技術棧。幾家上榜的國內感測器廠商,影像感測器龍頭韋爾股份、雷射雷達賽道領軍企業速騰聚創等均在推動感測器成為不再只是用於感知的硬體,而是在即時精準感知的基礎上,拓展更多和AI相關的功能。感測側借力端側AI提供更多資料處理、分類、融合的價值,最終透過具身感知來增強智慧體的理解和決策。
整合商作為機器人本體核心供應商,強化端側智慧能力亦是重中之重,依託模型賦能,實現多模態感知與高效決策已成為他們的首要任務。國內人形機器人第一股優必選已經表示在人形機器人應用場景中驗證DeepSeek技術的有效性,如多模態人機互動、複雜環境中的指令理解、工業場景中的任務分解與規劃等。
從這份世界百強榜單中,國內企業的崛起彰顯了本土產業鏈的成熟與創新能力。雖然在晶片領域仍面臨國際巨頭擠壓,但在整個產業鏈上是領先的。端側智慧化的大趨勢也在引領著國內機器人產業鏈軟硬體協同發展。
DeepSeek端側模型風暴加速機器人端側具身智慧
雖然這份報告中並沒有提及DeepSeek,但顯然DeepSeek面世後機器人賽道變化不小。DeepSeek在模型能力不遜於其他主流模型基礎上,又做到了算力成本更低。除了上述百強榜單中的優必選已經開始驗證DeepSeek+機器人技術的有效性,小鵬汽車也在積極探索DeepSeek在自動駕駛領域的應用,後續用在自家的人形機器人Iron上也是大機率事件。這些百強之外,產業鏈上的公司也在積極佈局,藉助DeepSeek帶動的端側模型革新尋找端側具身智慧的新正規化。
已經有訊息傳出宇樹科技與DeepSeek達成深度合作;前段時間Figure終止與OpenAI合作也有很多人認為 Figure 是在基於DeepSeek R1等開源模型進行開發機器人AI;獵戶星空的機器人AgentOS也接入DeepSeek……以DeepSeek為代表的優質模型已經成為人形機器人推動端側智慧邁向新高度的關鍵驅動力。
這些產業鏈上的舉動,從產業落地的角度來說,考量實現具身智慧的成本是決定性因素之一。雖然人形機器人現階段相比於其他智慧端側裝置,對成本並沒有那麼敏感,但硬體裝置想普及成本是最實際的問題。機器人運控、感知、決策任意環節的任一細分方向的智慧,都需要消耗大量算力來訓練資料。真機資料匱乏且貴是整個行業面臨的問題,模型模擬資料能緩解一部分資料匱乏的問題也還是需要模型篩選出高質量資料訓練解決泛化性和魯棒性問題。
DeepSeek透過高效推理能力降低資料訓練成本,提升訓練效率給機器人廠商開闢了一條更低成本的具身智慧實現路線。從資料到效能的轉化價效比是機器人想要落地必須考量的,能夠以更低的資料成本訓練出效能更好的具身模型自然會吸引更多廠商投入研發,加速端側具身智慧的實現。
在算力上,從國外的英偉達、高通、英特爾,到瑞芯微、晶晨股份、星宸科技、國科微、富瀚微、國芯科技、恆玄科技、樂鑫科技、中科藍訊、炬芯科技、安凱微、寒武紀、黑芝麻智慧等端側SoC、端側處理晶片廠商,包括廣和通、美格智慧、移遠通訊等端側模組廠商在內,都在積極擁抱DeepSeek帶來的端側智慧算力熱潮,在機器人賽道上積極佈局,進行軟硬協同最佳化,解放端側算力效率推動具身智慧願景。
另一方面,在機器人端側模型的適配上,DeepSeek的“開源+低價+蒸餾”模式(如透過API低成本呼叫、模型蒸餾技術生成垂直小模型),顯著降低了AI技術的應用門檻,使機器人能夠快速整合先進的自然語言處理初步處理與分析,在互動上迅速提升智慧化水平,還能結合多元資訊進行推理與決策,提供更高階智慧的服務。
和手機、PC、可穿戴等其他小型終端裝置略有不同的是,人形機器人的算力並不會那麼欠缺,在算力與能效的平衡上會更自由,能更好地支撐複雜端側模型的執行。透過DeepSeek代表性的跨維度知識蒸餾體系,將大模型的邏輯解構為思考推理,更適配機器人端側垂直應用場景,更人性化的思考也符合大家對具身智慧的期待。
其開源特性,也讓人形機器人公司能夠自主的構建閉環的智慧模型,模型與機器人適配度會更高,技術棧上也避免受制於人。Figure終止與OpenAI合作很大一部分考量也是在這方面。近日Figure宣佈推出的重大AI更新——自主研發的通用具身智慧VLA模型Helix,也的確是走了自研這條路。
人形機器人發展到高階智慧,多模態理解能力是機器人VLA視覺語言行動模型的核心,亦是實現具身智慧的關鍵。在觸覺資訊處理能力成熟後,發展成全模態VTLA模型也是必要的。
DeepSeek已經提出過視覺語言模型——DeepSeek-VL,能進行多模態資料訓練。近期北京大學聯合香港科技大學在則DeepSeek-R1基礎上釋出了多模態版DeepSeek-R1——Align-DS-V,完成了從文字到視覺理解的拓展。北大團隊表示“這種全模態的資訊流對於大模型範式轉向通用人工智慧也一樣重要”。

除了廠商自研,充分利用DeepSeek構建機器人多模態模型也是一條不錯的技術路徑,這一改變帶來的助力將會在後續的發展中逐步顯現。
不論是在囊括一切資訊流的VLA模型中,還是在具體任務落地中用到的 MoE小模型組合中,DeepSeek給了演算法平臺商和終端本體廠商更多的技術路徑選擇。現在還很難說哪條技術路線能引領產業走向終局的物理AI,但不可否認的是DeepSeek出現帶動的端側模型的爆發與革新,解決了機器人在複雜決策場景中構建起感知-理解-推演的閉環認知體系的部分難題,推動了端側模型與人形機器人的結合落地,加速了端側實現具身智慧。
寫在最後
中國具身智慧人形機器人產業鏈的崛起,是技術突破、政策引導與場景落地的綜合結果;而優質多模態模型的融合將加速機器人向智慧化、多模態互動方向演進。未來,兩者的協同或成為全球AI與機器人產業競爭的核心變數。



