
春節期間,不同型別的機器人吸引了公眾的關注。春晚舞臺上,身著花棉襖的機器人翩翩起舞;泰山的陡峭山巔,外骨骼機器人幫助遊客順利登頂;在海南,U型機器人與衝浪教練攜手營救落水遊客。
2024年,具身智慧行業迎來了深刻的變革。硬體層面,機器人形態趨於標準化,越來越多的公司能夠迅速打造出具備人形外觀的機器人;軟體層面,技術路徑日漸明晰,行業正在向機器人基礎大模型的框架邁進;與此同時,行業的“入局者”也呈現多元化趨勢——除傳統機器人領域的企業外,自動駕駛和大廠背景的創業者們紛紛投身於這一前沿科技領域。
具身智慧的發展令人矚目,但依舊存在一些亟待深入探討的問題:如何突破機器人商業化的瓶頸?具身智慧還需在哪些方面進一步完善其本體?如何提升機器人操作的泛化能力,使其能夠適應更多樣化的應用場景?大模型對具身智慧發展帶來了怎樣的深遠影響?
在峰瑞資本2024年投資人年度峰會上,逐際動力創始人張巍博士發表了題為《具身智慧:機遇與挑戰》的演講,分享了他對具身智慧領域前沿技術、商業化路徑等方面的思考。
我們也邀請了峰瑞資本副總裁顏黔杭補充分享了其對具身智慧領域的投資思考,詳見文末,希望能提供新的視角。

逐際動力創始人首次公開演講:機器人缺的不是「大腦」,而是學習能力
來源:RoboX
作者:小曹

/ 01 /
“代替人和協助人是兩件事”
張巍認為,具身智慧是當下最火的一條賽道,儘管它目前仍面臨很多問題和質疑,但背後還是有一個共識——具身智慧是未來十年人類最重要的科技革命。
如果機器人的定位是“代替人完成可以改變物理世界的任務”,這其中就有兩個關鍵詞——“代替人”和“任務”,它們看似簡單,其實往往是巨大的陷阱——如果不理解透這兩個詞,具身智慧落地就會變得異常複雜。
他表示,逐際動力(以下簡稱“逐際”)的觀點和定位,並非是讓機器人去代替人,而是Empower人——“機器人不會代替人,它背後的邏輯是很複雜的。”
首先,張巍用兩個具身智慧型別,分析了其背後的商業化難點。
1、機器人+AI:他表示,上一代的機器人+AI模式已經持續很長一段時間,這是商業化最難的方向,它可能只是“海市蜃樓”。
此類機器人能在工廠裡能完成非常複雜的分揀任務,或者快遞包裹分揀。但是它們在真正的商業閉環上,還是有很多挑戰的:“沒準賣出去的那一剎那,就是賠錢的開始。”
2、無人駕駛:在張巍看來,從2016-2024年,無人駕駛已經發展了很長時間,卻仍難以評判其成熟度——“當感覺找到“技術開關”時,卻還是有“最後的10%”的難度是無法估計的,恰恰就是這10%,是影響整體發展的關鍵。”
同時,其商業價值也很難判斷。因為代替人,和協助人,這兩件事是有本質區別的,它們有著不同的商業模式,也會帶來不同的產品,這兩種產品所經受的考驗是完全不一樣的。
讓機器人“用起來”其實非常簡單,可是形成商業閉環卻非常難。現在上路的無人車,或者配送車的本體,都不是主角,在整個商業價值鏈條裡可能佔比不到10%。
同樣的,機器人產品本身也只佔商業鏈條的不到10%,剩下的部署維護、改造場景,協作關係等部分才是最大的開銷。所以機器人不光有好的本體,還一定要有資料工具、訓練工具、部署工具,以及維護工具,這一整套的效率體系才是競爭力,而非本體。
同理,如果想讓機器人代替人,並非改變本體的問題,而是要改變一整套協作關係。
/ 02 /
大語言模型,能做的仍很有限
現在提到具身智慧,人們都會聯想到與大語言模型的結合。例如,要想將人類的意圖告訴機器,就需要task encoding或者embedding(任務編碼或嵌入),大腦要先對task進行處理和決策,再由小腦去執行運動。
對比起來看的話,無人車是非常簡單的具身智慧任務,因為其任務定義很明確,唯一目標就是到達目的地,在結構化的道路上移動。而且,無人車的“小腦”就是底盤和域控制器,如今也已經非常成熟。
即便如此,張巍也不認為目前的無人駕駛可算作“完全替代人”:“它本質上還是AI+人。無人駕駛只是用技術改變了人開車的方式。”
而對於具身智慧來說,完全代替人類更加困難。張巍用一個很簡單的任務舉例:收拾一下桌子。可這樣的任務卻很難被機器人拆解和執行,比如,到底收拾桌子上的哪些物品,收拾到什麼程度算乾淨?“如果沒有大語言模型,大家甚至都不太敢想機器人能執行這樣的任務。但現在只是敢想,具體怎麼做還不清楚。”
/ 03 /
具身智慧行業還需要發展哪一種本體?

理想化的想法,是用資料堆出一個“具身大腦”,同時也有通用小腦+通用本體,就能完成各種任務。
但是張巍認為,採用一致的通用本體形態,是沒有必要的。對此,他總結出現有的四大本體型別:
-
機械臂,它的控制器小腦極其成熟。
-
輪式底盤+雙臂,它的控制器也相對成熟。
-
人形+人形特有的小腦。
-
人形的下半身,只有雙腿或四腿,主要完成locomotion(移動能力)的任務。

▲ 逐際動力人形機器人CL。圖片來源:逐際動力
本質上機器人就在做兩件事:代替人的雙手來操作、代替人的雙腿來移動。他認為,在行業發展過程中,創造最大價值的應該是這兩類本體,所以逐際也是選擇做這兩類。“押寶押哪一個,去做哪種本體?我認為這不是一個好問題,好的問題是‘這個行業還需要發展哪一種本體’。”
在他看來,要想做高價值的本體,需要3個條件:1、目前在物理世界中尚不存在;2、原理上可支援被做出來;3、未來一定是機器人形態中的一種。
/ 04 /
模型就像牛頓定律,是歷史資料的壓縮
“有觀點認為,一個大模型,就可能成為整個具身智慧的大腦。其實這是個不切實際的想法,其實具身智慧要好多大腦。而且現在我們不缺某個領域裡的大腦,我們缺的是學習的能力,也就是高效處理資料的能力。”張巍說道。
張巍認為,具身演算法定義硬體,但資料定義演算法。所有的資料都要被用上,尤其是真機資料(在真實硬體裝置上採集和生成的資料)很重要。
不可否認的是,模擬是一種對模型的使用方式,且模擬和模型對資料的發生和產生都有巨大幫助。但是如果從資料整合的角度來看,模型是歷史資料的壓縮,就像牛頓定律,可以看作是對所有運動物體的資料的一個壓縮,且壓縮得比較好。
“所有壓縮好的資料,都可以用來產生新的資料,幫助推進泛化。”泛化性意味著機器人能夠將從特定環境或任務中獲得的經驗,遷移到新的環境或任務中。例如,一個機器人可能在特定的房間內學會如何避開障礙物,但其泛化性強的話,它應該能夠在不同的環境裡也能有效避障。
他指出,操作的泛化性有好多種,有分模組的,有端到端的,它們本質是對資料的利用和假設的不同方式。

▲ 逐際動力人形機器人CL正在“亞洲蹲”。
圖片來源:逐際動力
“但是當前,我們的所有資料處理方法都難以達到理想中的功能需求。所以現在不能盲目地追求在一種方法上堆資料、提升效能,而是要找到‘曲線D’,也就是我稱之為‘效能資料比’或者‘資料效能轉化率’的一條曲線。”
那麼,怎樣才能提升資料利用率?張巍表示,其實從容易獲得的規則資料中,有很多資訊能幫助我們指導操作的泛化性。
他展示了一個逐際動力的案例——不需要大規模採集真機和模擬資料,而是透過text prompt,讓大模型生成人類操作的影片,就能指導協作機械臂完成操作任務。“我們的資料利用率,可達當前演算法的100倍。”張巍說道。
他表示,逐際之所以做人形本體加全控小腦,是希望將“未來一定有用,現在還沒有做得很好”的這一類東西做好。
同時,逐際也在研發低成本的具身大腦工業母機,探索一種新型的學習訓練方式,以求具身智慧可以在任意領域中以更高的效率去完成可泛化的任務。
張巍強調稱,逐際動力的核心的定位一直都是Empower innovators:“我們不直接進工廠,我們的定位是希望做具身智慧的英偉達,將具身智慧創新、落地的效率提升百倍千倍。”
據他透露,目前逐際的人形機器人(大負載全身搬運)已經用最低成本的方式完成了原理驗證,而且是在驗證目標沒有被取捨掉的前提下。同時,逐際還將釋出第一款全尺寸人形機器人,能夠原地起立、直膝行走。

▲ 逐際動力全尺寸人形機器人。圖片來源:逐際動力
/ 05 /
投資人說:我們如何看具身智慧行業?

感謝張博深入的洞察和思考。峰瑞資本持續關注具身智慧領域的創新機會,非常歡迎相關領域的創業者、投資人與我們深入交流,請聯絡[email protected]
在具身智慧領域,我們看到如下變化與機會:
一、2024年,具身智慧行業發生的重大變化
2024年,具身智慧市場經歷了顯著的變化,主要體現在硬體和軟體兩個方面。
硬體層面,機器人形態趨於統一。行業逐漸形成共識,機器人整體結構和核心零部件的選型設計趨同。這意味著硬體搭建的門檻大幅降低,越來越多的公司能夠快速搭建出人形機器人。
軟體層面,技術路徑更加清晰。過去,機器人主要依賴於模型預測控制(MPC)、模仿學習和強化學習等單點策略實現某類任務。而現在,行業正向機器人基礎大模型的框架靠攏。具體來說,機器人透過影片預訓練、高質量資料的微調(SFT),以及實際場景的資料反饋進行強化學習,最佳化任務表現。
此外,入局者也發生了變化。除了傳統的機器人行業從業者,自動駕駛企業和大廠背景的創業者也開始投身具身智慧領域。這一趨勢在2024年下半年尤為明顯,人形機器人市場正在吸引更多跨行業的關注和資源。
二、全球具身智慧的發展階段與中國市場的獨特優勢
目前,全球具身智慧行業處於技術逐步收斂的階段,各家的方法論趨於相似,擁抱AI。具體來說,操作和運動控制都開始強調基礎大模型和全身運動控制。
然而,仍有一些挑戰亟待解決,比如:
-
如何更好地實現全身控制,提高機器人的運動能力。
-
如何整合物理世界的感測資料,在機器人運動智慧決策模組實現即時反饋。
-
如何實現機器人基礎大模型的泛化能力(面對新樣本時的預測能力)。
中國市場的獨特優勢在於硬體供應鏈響應速度快,下游工業和服務業場景對機器人的需求量大,資料積累豐富。這些優勢為國內廠商提供了良好的發展基礎。然而,挑戰也同樣存在,特別是在關鍵技術研發和產品化方面,國內廠商需要突破現有的技術瓶頸,才能在競爭格局中佔據有利位置。
三、逐際動力為具身智慧行業帶來新的可能性
2024年,逐際動力在人形機器人領域的技術和產品兩方面都取得了顯著進展,為具身智慧行業帶來新的可能性。
技術層面,逐際一直走在行業前沿,持續推動人形機器人全身運動、感知決策、任務執行等核心技術的研發。產品層面,逐際推出創新的“三合一”模組化產品Tron1,主要面向科研市場。這一產品為下游客戶提供了一個軟硬體完善的平臺,幫助他們實現研發和落地的需求。人形機器人最新一代產品即將在25年釋出,我們非常期待。
四、2025年,具身智慧賽道的機遇
2025年,具身智慧賽道的機遇與挑戰並存。從融資和創業的角度來看,隨著創業者不斷湧現,主流基金已經在具身智慧領域完成了佈局,新公司的融資機遇相比於前兩年會門檻會提升。
然而,從技術角度來看,具身智慧仍處於科研階段,尚未形成大規模商業化。因此,對於那些在關鍵技術挑戰上(如全身控制、泛化能力等)有底層創新的公司,依然有切入創業的視窗期。
五、具身智慧的商業化應用前景
近期,機器人相關影片爆火,比如機器人在春晚搖手絹、登山徒步等等,反映了公眾對機器人的美好期許。但這些影片更多展示了機器人的運動能力和智慧化水平,搖手絹或登山徒步這些場景是一個很具象的展現方式,讓公眾對人形機器人的商業化未來充滿期待。
整體來看,具身智慧的商業化應用前景廣闊,但目前仍處於早期技術研發階段,距離產品化和大規模商業化還有較長的路徑。
人形機器人商業化的關鍵在於控制機器人的產品化成本,以及機器人高效完成通用化任務的能力。短期內,人形機器人的商業化應用仍以科研和展示為主。未來,真正的商業化應用可能會率先出現在工業和服務業領域。
目前市場的共識是,人形機器人將成為輔助人類的智慧助理(機器人形態的AI Agent),而不是簡單的替代人力。例如,在重複性體力勞動與對人身健康不友好的場景,機器人可以成為“得力助手”,提高人的工作效率。
以上是我對具身智慧領域的一些思考,非常期待與具身智慧領域的從業者交流。

▲ 分享給你13篇行研+1檔播客,祝你開工大吉
▲ 峰瑞2024年終回顧:一起走更遠的路,做正確而非容易的事
▲ 通往具身智慧之路 | 峰瑞報告 37
▲ 具身智慧 vs. 運動科技:一個讓機器像人,一個把人變成機器?| 峰瑞報告
▲ 具身智慧離現實有多遠:熱潮、泡沫、技術前沿、商業化 | 峰瑞研究所
星標峰瑞資本微信公眾號
一手商業思考及時送達
