

小紀有話說:
文章來源:騰訊科技 公眾號
騰訊科技《AI未來指北》特約作者:小燕
原標題:機器人跑馬拉松,累到“斷腿”的是工程師

人形機器人為什麼需要一場馬拉松?
Nixon:我們先聊個輕鬆的話題——當你們聽說“人形機器人跑馬拉松”這件事情時,第一反應是什麼?是覺得大膽,還是覺得有點離譜?
於浩:我當時確實感到驚訝。此前有媒體找我聊過“機器人爬山”的想法,我就覺得難度太高,實施起來很難。沒想到不久之後就聽說要辦“機器人馬拉松”。
起初,我以為比賽要求機器人全程自主執行,瞭解後發現,主辦方允許使用“遙控”甚至“跟跑”模式,整體門檻並沒有想象中那麼高。但這也未嘗不是件好事。畢竟目前的人形機器人在技術和應用上都還不夠成熟,與其把比賽當作競技,不如看作一個展示平臺。不同企業帶來了各式各樣的機器人,有高有矮、功能各異,不僅可以展示優勢,也能暴露短板,是行業互相觀摩、交流的好機會。
這就是我們常說的“PDCA”迴圈——Plan、Do、Check、Action(即計劃、執行、檢查、處理的閉環管理流程)。透過實踐暴露問題,再進行最佳化,是一個很好的閉環過程。
諶威:這是一個行業對外展示階段性成果的機會。就像賽車一樣,不是隻靠一臺車,而是背後有完整的保障系統支撐。人形機器人要“跑起來”,背後也同樣需要一個協調配合的團隊。這次馬拉松的意義,不在於比誰跑得快,而在於有沒有勇氣邁出這一步。
從參賽方式來看,目前“遙控”佔了主流。因為“跟跑”模式對環境要求比較高,穩定性也不太好。一般需要一個領跑員與機器人保持三到五米的距離,身上貼有二維碼或其他識別標識,機器人透過視覺追蹤技術實現跟隨。這種方式對識別精度和路徑控制要求都很高,容錯空間非常小。
Nixon:說到底,這其實是一項系統工程。即便兩臺機器人外形完全一致,它們的摩擦力、限速設定、調校精度等細節也可能不一樣,結果跑出來的軌跡也可能完全不同。
諶威:沒錯。每臺機器人都需要專人除錯——哪怕只是兩條腿的摩擦力不一致,都有可能影響行走路徑和整體穩定性。
現在的機器人,遠不是“即插即用”的裝置,而是一個高度複雜的系統整合體。所以這也十分費人力,光是準備一臺參賽機器人,就有二三十人參與,涉及演算法開發、硬體除錯、現場運維等多個環節。
於浩:所以大家擔心機器人“搶飯碗”,其實為時尚早。就現在來看,一臺機器人背後,可能還要靠幾十個人共同推動它前進。
我之前也開玩笑說,跑一場機器人馬拉松,至少得有人跟著背電池、做維修。這不僅沒有取代人類的工作,反而還創造了一些新工作崗位。
諶威:不少機器人公司光現場執行的團隊,就有三個人。一個負責操作控制,一個處理突發情況,另一個負責後勤保障,跟著保障車一起行動。車上會裝有備用電池、電源、支架等裝置,確保機器人在遇到問題時能快速應對。
於浩:就像足球比賽中有醫療團隊隨時待命,這邊也是一樣,算是“機器人馬拉松的醫療車”。
諶威:是的。而且主辦方也設定了七個補給站,每隔三公里提供電池更換和必要的物資,保障體系還是比較完備的。
Nixon:我也特別想強調這一點。這次是半程馬拉松,不是全馬。主辦方鼓勵企業用一臺機器人跑完整程,但中途換機器人、換電池等操作都是被允許的,只要在時間限制內完成即可。
另外,這次的關門時間也比人類半馬延長了半小時,就是考慮到機器人整體速度會更慢。因此,這場比賽考驗的並不是誰跑得最快,而是誰能穩定、安全地堅持到終點。
諶威:對,這次比賽最特別的一點是所有參賽企業都在統一標準下誠實面對自己的技術狀態,不再像過去那樣透過剪輯展示“機器人陪我一天”的表演場景。對於公眾來說,這次是非常難得的真實展示,也是一種科學普及。

一場長跑,能否證明人形機器人核心競爭力?
Nixon:接下來我們深入聊一聊。從機電系統、控制演算法等角度出發,機器人要完成一場馬拉松,核心挑戰究竟有哪些?
諶威:從系統層面看,最核心的挑戰之一是關節設計,整個行業目前大致分為三種方案:諧波關節、行星關節和直線關節(行星滾柱絲槓)。
它們在減速器結構上存在差異,減速器的作用是將電機的高速、低扭矩轉換為適合關節運動的低速、高扭矩。減速比的不同,會直接影響機器人輸出的效率和響應能力。
打個比方,就像騎腳踏車換擋,不同擋位下,踩踏的感覺完全不同。比如一些可以跳舞、鯉魚打挺的機器人,多采用高響應、高效率的行星關節,整機高度在1.3米左右,重心低,平衡性好。
於浩:關節結構、演算法能力和身高體型這些要素,都會共同影響機器人的運動表現。
諶威:沒錯。除了結構,還有一個關鍵挑戰是散熱。運動強度大的機器人電流大,發熱量高,甚至可能是普通方案的三到四倍。必須解決熱管理問題,才能保證長時間穩定執行。諧波關節方案雖然功率不算太高,但可以持續執行一到兩個小時,適合長時間任務。
Nixon:那如果熱控沒有問題,但速度不夠,是不是就只能慢慢地“走”?
諶威:是的,熱控穩固的機器人,可能犧牲了速度,表現更像是穩定地“行走”而非“奔跑”。
而且在軟體演算法層面,現實環境和實驗室差距很大。像亦莊這次的賽道,地面並不平整,中間略高、兩側稍低,還可能出現減速帶和碎石。這種複雜地形對演算法的魯棒性要求很高——機器人必須在受到干擾時依然能保持平衡,否則很容易偏移甚至摔倒。
Nixon:所以行業大致可以分為兩類機器人:一類是“等人高”的大個子,雖然跑得慢,但穩定、持久,適合長距離任務;另一類是身高約一米的小型機器人,動作快、靈活,但續航較弱,適合表演型場景?
諶威:可以這麼分。大體型機器人更強調是否能減少進補給站、穩定持續地執行;而小型機器人則更注重速度和動作表現。
Nixon:那於浩老師,從投資者的角度來看,如果我們把“馬拉松”作為一個能力背書,它究竟能代表哪些技術水平?
於浩:我覺得這要看具體的比賽模式。
如果是遙控模式,考察的主要是硬體層面的能力,比如關節、電機、能耗、散熱等;如果是全自主模式,那就需要機器人具備環境感知、路徑規劃、動作決策等能力,難度更高;跟跑模式則是另外一種,需要機器人能夠準確跟隨、快速響應前方目標。
所以三種模式的能力要求是有本質區別的。但無論是哪種模式,關節強度、熱控能力、系統魯棒性這些底層指標是共通的,特別是在馬拉松這種長距離場景中,更容易暴露出系統級的問題。
就像足球隊比賽前要踩場一樣,機器人也需要提前適應實際場地。現實中可能遇到各種不可控因素,比如突發大風、其他機器人摔倒等,這些情況都需要演算法層面做出快速判斷與調整。
Nixon:確實。如果機器人遇上坡道或強風,要如何保持平衡?
於浩:這要看是否是自主控制。如果是遙控,那就靠人來判斷環境並手動干預;如果是自主模式,那就需要依靠機器人大腦中的感知系統即時做決策。
諶威:機器人在行走、爬坡或步態恢復時,所有關節模組的資料和其他感測器資料,都會在控制晶片裡建模,它會即時地調整引數,在一秒鐘內對機器人身上電機發近千次指令,來維持整個機器人系統平衡。
Nixon:也就是說,即便是遙控模式,機器人仍然需要一定的“自我判斷”能力,而遙控更多隻是起到導航的作用?
諶威:可以這麼理解。自動駕駛依賴高畫質地圖導航,而機器人當前還做不到完全等效的路徑規劃。在保持平衡這件事上,最終靠的還是機器人自身的大腦去即時判斷和決策。
不同廠商在模型訓練和演算法實現上存在很大差異。有的機器人專門訓練過上下坡、臺階,有的只能應對平地。
Nixon:明白。那除了運動控制和環境適應之外,在戶外“開放式馬拉松”中,還有哪些關鍵瓶頸需要突破?
諶威:挑戰還挺多。比如結構穩定性——機器人在長時間高頻運動中,會不斷承受震動和衝擊。結構件如果設計不合理,很容易出現鬆動甚至損壞,尤其是在金屬材料反覆受力的情況下,會產生“金屬疲勞”,導致強度下降甚至斷裂。這在長距離、高強度的馬拉松中尤其需要重視。
另一個關鍵問題是換電。實驗室裡常用的是直連電源或標準電池包,但戶外比賽要求快速換電,最好是熱插拔結構。有些廠商已經做了這方面的設計,比如主控電源有備用供電模組,主要電池則像無人機一樣,可以“一插即用”,整個更換過程甚至不需要一分鐘。
於浩:我們常說“熱插拔”,其實就是在不中斷機器執行的情況下更換電池。這個概念可能有些觀眾還不太熟悉,簡單解釋一下是很有必要的。
諶威:對,就是在不關機的狀態下完成電池更換,效率更高,也更安全。
Nixon:明白了。剛才你們還提到一個“金屬疲勞”問題,透過一些資料,我們確實看到不少相關的損傷案例。
於浩:金屬疲勞是個重要因素,另外還有一個容易被忽略的問題是通訊干擾。你想象一下,現場有那麼多機器人同時執行,全靠無線訊號連線,訊號之間非常容易互相干擾。
諶威:尤其在賽道周邊有地鐵、人群密集、手機訊號重疊的地方,干擾會更加明顯。
於浩:機器人本身帶著大量電機,電磁干擾強。現在又缺乏統一的賽事標準,不同廠商的通訊模組可能都工作在相同頻段,這就容易造成系統級別的干擾風險。
還有一點值得強調,現在很多人對人形機器人抱有很高的期望,但實際上它的難度甚至超過了自動駕駛。汽車只需要在二維平面上控制,而人形機器人採用雙足運動,涉及平衡保持、重心變化、動態反饋等一系列複雜變數。因此,我們應當對這項技術保持足夠的理解和耐心。
Nixon:確實。比如有機器人公司公開表示,他們在測試中出現過腳踝結構斷裂的問題。有的團隊嘗試讓機器人“穿鞋”,據說這樣能顯著提升續航和跑速。大家如果有機會到現場,可以留意一下“穿鞋”和“不穿鞋”之間的差異。
諶威:人形機器人如果金屬腳直接著地,震動會非常強烈。穿鞋確實可以起到一定的減震作用。
於浩:但我有一個疑問:穿鞋是否會引入更多不確定性?比如鞋底摩擦係數、結構穩定性這些因素,會不會反而帶來新的問題?
諶威:目前大多數機器人的“腳底”結構,確實還不具備像人類鞋子那樣的摩擦力和人體工學屬性。穿鞋其實是藉助人類長期演化出來的成熟減震工具。有一些機器人公司也在嘗試開發橡膠腳墊版本,希望在減震效能和結構穩定性之間取得平衡。
於浩:我理解了。從工程角度來看,結構越複雜,變數就越多。能否透過更簡潔的設計實現同樣的效果,也值得探索。
Nixon:那關節在長時間運動下,散熱問題怎麼解決?比如跑完整個21公里,一個關節可能要連續運動十幾萬次。
諶威:目前大多數機器人主要依賴金屬外殼進行被動散熱。從技術上,大家的核心思路是從電機本體出發解決發熱問題,比如透過最佳化繞線方式、提升減速器效率、改進金屬結構的導熱性等手段來降低熱量積聚。
最終目標是提高關節的“扭矩密度”——也就是在更輕的結構下,實現更高輸出的同時降低發熱與電流負載。此外,諧波減速器相較於傳統的行星減速器,它在散熱效率和整體效能上具備優勢。
Nixon:現在很多研究報告也在強調,諧波減速器是人形機器人中的核心零部件。
於浩:沒錯。機器人運動和汽車不一樣,我們常說“加速容易,減速難”。特別是在機器人跑步減速的過程中,控制演算法尤為關鍵。這個階段往往需要雙腳同時發力,平衡和協調性都處於最不穩定的狀態。
Nixon:是的,我剛才想表達的是,人形機器人在減速階段,需要雙腳同步發力,而在加速時主要依賴單腳發力。這種“雙足協同”的控制邏輯,對系統的協調性和控制演算法都提出了更高的要求,可能就像人類雙手協同操作複雜任務一樣。那麼,下肢在減速階段的這種配合,會不會在演算法層面帶來額外挑戰?
於浩:確實如此。減速階段最關鍵的是保持平衡,同時還要處理雙腳間的協調配合,演算法的難度會更高。
諶威:如果要從演算法層面進行細化講解,可能需要專門的演算法團隊來展開。目前行業主流的方法是使用“統一框架+自我學習”的策略來解決,比如透過強化學習,把加速、減速、不同地形等各種狀態都透過訓練覆蓋進去。
所以並不是把每個動作用顯式規則寫死,而是透過大量資料訓練,把這些狀態“跑”出來,讓機器人逐漸學會應對各種複雜情形。
Nixon:明白了。也就是說,像前進、減速、轉彎這些狀態切換,並不是靠具體規則一步步控制,而是作為整體被打包在強化學習模型中,讓系統在執行中自己“學會”。
諶威:對。靠的就是大量訓練和資料積累,去不斷最佳化模型,讓機器人在不同狀態下都能做出合理反應。
Nixon:既然是比誰跑得快,為什麼不用機器狗?四足機器人目前運動能力更強,有的甚至結合了輪腿結構,效率和速度都更優。那為什麼這場馬拉松一定要用“人形”機器人來跑?這背後的意義是什麼?
於浩:我們最近其實也討論過這個問題——為什麼一定要“人形”?我認為這和人類對機器人的長期想象有關。
從小時候看《鐵臂阿童木》開始,我們心中“機器人”的原型就是有手有腳、像人一樣的存在。這個“人形”形態像是一種文化符號,也是一種心理投射。就像中國神話中女媧造人,是用黃土捏出人的樣子。人形機器人在某種程度上承載了我們最早對工具的想象——它要像我們、替代我們、進入我們原本的位置。
從實用角度看,人形也確實更適合進入人類環境中。不管是爬樓梯、開門、扶電梯還是坐辦公桌,人形結構都能直接適配現有的社會環境。而機器狗或其他異形結構則需要重新設計空間和工具,整體改造成本很高。
所以說,人形是一種“通用性更強的替代形態”,哪怕它在效率上不是最優的選擇。
Nixon:諶總,你作為做關節的,從產品落地的角度來看,人形和機器狗的區別在哪?
諶威:首先,這次是馬拉松比賽,而馬拉松本就是人類的競技專案,人形機器人參與在形式上是合情合理的。從功能上講,我總結了幾點:
第一,這個世界是為人類設計的,人形機器人在空間適應性方面天然具有優勢。
第二,目前的工具和介面大多服務於人的身體結構,比如把手、按鈕、工具的大小和高度都基於人設計,人形機器人可以無縫對接,無需額外改造。
第三,統一的形態有利於規模化生產。就像汽車的“四輪”已經成為工業標準,“雙足+兩臂”的人形也是一種可以標準化的工業形態,有助於複製和降本。
第四點很關鍵,是關於資料遷移。人類的行為資料可以直接用於訓練人形機器人,而要把這些資料遷移到機器狗等異形結構上,訓練成本更高,轉化效率也更低。
而且,這次比賽不只是為了“跑”,它本質上是在測試人形機器人的“基礎身體能力”。我記得去年在世界人工智慧大會上,全國範圍內真正能“走起來”的機器人其實並不多,大部分還需要吊裝輔助。
但這次不同,大家的機器人都動起來、走起來了。說明在系統穩定性、關節效能、控制演算法等方面,行業已經逐步邁過了“能動”的門檻。馬拉松是一種非常適合做“壓力測試”的場景,就像人類體檢一樣,你得先透過基礎體能測試,才能進入更高階任務。
之後我們可能會看到更多不同體型的機器人登場,不止是標準身高的一米七,也許兩米高的大個子也能參與其中。這說明整個行業正在向前邁出一大步。
Nixon:剛才你提到資料訓練,這一點確實很關鍵。我們很難讓一隻真實的狗去為機器狗做標準示範,但人類不同。人類在各類真實工作場景中的行為資料,可以被直接採集和結構化,用作人形機器人學習的輸入。訓練效果的關鍵,只在於資料的時間跨度和規模大小。
諶威:是的,人類的資料天然具有高度結構化的特點,非常適合遷移到人形機器人系統中。這也是人形形態更具“學習效率”的一個重要原因。

人形機器人參與馬拉松
是否具備實際應用的遷移價值?
Nixon:我們進入今天的最後一個部分。現在我們看到,有的機器人在馬拉松中展現出較強的耐力,有的則更突出動力效能。你們怎麼看,這些能力是否可能遷移到實際應用場景?比如安防、配送等需要長時間執行、路況複雜的環境,是否可以藉此建立起更強的工程能力?
諶威:我認為答案是肯定的。馬拉松對機器人而言,其實是一種基礎能力測試。而未來的真實應用場景,對它的要求只會更高。比如在工廠中,機器人可能需要連續執行八小時以上,目前主流人形機器人的續航能力通常只有一到兩個小時。再如電網巡檢、山區作業這類任務,地形複雜,對機器人保持動態平衡的要求更高。還有像核工業這種特殊場景,還涉及強電磁干擾等問題,對系統穩定性構成巨大挑戰。
因此,未來的機器人形態一定是高度定製化的。我們提供的是一套人形平臺方案,但真正落地時,需要根據不同行業的具體需求進行二次開發。這也是我們強調“從本體關節出發”構建可擴充套件系統的原因。
於浩:我非常認同。無論這次比賽中體現出的是技術優勢,還是暴露的問題,最終都會反哺研發工作。比如關節疲勞、電源管理、散熱策略等,都是下一階段可以重點最佳化的方向。
從本質上看,馬拉松是一個任務目標單一、互動行為較少的場景,但它為我們提供了一個高強度、長週期的“能力壓測”視窗,對產品穩定性和演算法魯棒性來說,是一個非常有價值的檢驗平臺。
未來的機器人形態不會只有人形一種,也不一定必須依靠電池供能。在工業場景中,完全可以使用外接電源解決續航問題;甚至有些應用場景並不需要下半身,只有上肢系統也可以獨立完成任務。
諶威:我們確實也有客戶只採購雙臂系統,不需要完整的人形平臺。
於浩:關鍵在於找到“最合適的機器人形態”來完成“最合適的任務”。掃地機器人就是一個非常成功的例子,輪式結構穩定、高效,反而更適合它的功能。如果把它做成人形,那就成了畫蛇添足。
我以前在高校還見過一臺刀削麵機器人,只有兩隻機械臂,沒有下半身,但它可以連續、穩定地完成任務。這就是典型的“形態合適”。
所以我們辦這場馬拉松,並不是為了驗證“機器人能不能跑完”,而是藉助這個過程探索:哪些能力具備遷移價值、哪些技術可以跨場景整合。
Nixon:我理解,現在大家對人形機器人的關注,很大一部分來自於它們的“運動能力”終於達到了某個門檻。雖然它們目前還不能勝任複雜的感知或服務類任務,但僅憑“能走、能跑、能保持穩定”,就已經能夠登上春晚、出現在展會等舞臺。
而馬拉松,把這個“運動能力”進一步推向極限——要求它長時間執行、高速切換狀態、結構耐久可靠。
我設想,未來是不是可以按照體型、驅動結構設立分組,比如設1米2和1米7兩個身高等級。這樣廠商就會圍繞這些標準化目標進行專項最佳化,就像汽車拉力賽那樣,推動行業建立分級標準、帶動上下游配套。
比如在這次比賽中,最大挑戰可能不是演算法,而是底層機電系統。如果能提升能量轉化效率,那意味著機器人可以跑得更遠、工作更久。
諶威:我補充一點。人形機器人在短期內確實更像是一個技術探索方向,它推動的是整個行業的“能力上限”。但在這個過程中,很多關鍵模組會向下沉澱。
舉個例子,過去在工業自動化場景中,人類仍需介入處理那些非結構化的複雜任務。但當我們把人形機器人路徑中發展出的智慧模組,比如視覺識別、多模態控制等,移植到傳統機械臂系統中,它立刻就能勝任更多產品、更復雜的任務。
所以人形機器人的意義,並不僅僅是要“通用替代人類”,而在於它撬動了整條產業鏈對“複雜智慧”的重新構建。
從單臂到雙臂的演進,不只是提升了操作的自由度,也拓展了任務的複雜度。正如於總所說,人形並不一定是“雙足+雙臂”的完整形態,“雙臂優先”的構型在很多實際場景中也非常有價值。
Nixon:未來我們是不是可以增加一些新測試專案,比如評估操作能力?讓機器人在封閉空間裡完成如洗碗、做飯等需要感知和精細動作配合的任務。
於浩:我看到這次已經設有“人氣獎”這種軟性評估指標。未來也許可以考慮引入“互動性”測試,比如擬人面板、互動邏輯等設計,讓機器人透過更有表現力的形象與觀眾建立連線。這也體現了人機關係的一種演化趨勢。
Nixon:那我們最後再討論一個現實問題。今天參加比賽的企業中,有些表現很出色。在投資人眼中,這些“領先者”是否具有真正的成長性?它們的商業模式是否已經具備清晰路徑?於總,你怎麼看?
於浩:這是一個非常現實且重要的問題。我們把這次馬拉松當作一次“技術嘉年華”,是希望讓更多人直觀地理解機器人行業的發展現狀。但回到投資邏輯,最終決定一家企業能否走得長遠的,仍然是商業模式是否成立——也就是技術是否能與實際場景對接,能否形成閉環。
哪怕技術再先進,如果沒有合適的落地場景,也難以構建起可持續的商業迴圈。中國的優勢就在於產業基礎完善、應用場景豐富。只要能找到真實的需求側,就有機會形成“技術—應用—成本”三位一體的正向生態。
從控制論的角度來看,這本質上是一個“正反饋迴路”——成功的應用帶動技術成熟,成熟的技術進一步提升應用效率。大模型的火爆,就是這種“湧現機制”的典型案例。
我認為在機器人這個賽道上,“應用落地”仍是主線。投資人、研發人員、商業團隊三方必須緊密配合,找到合適的場景和成本結構,整個行業才能走向成熟。
Nixon:確實。商業模式從來不是一開始就明確的。人形機器人剛能跳舞的時候,沒人想到它能登上春晚、成了舞臺主角。這就是應用的自然演化。
比如在國外,還有人提出“養老機器人+保險服務”的組合模式。包括政策、法律、支付體系等各個環節,都需要隨著產業進展逐步構建。
諶威:從我們產業內的理解出發,機器人系統可以被拆分為三層:
第一層是硬體本體,第二層是“小腦”——也就是控制演算法,第三層是“大腦”——任務規劃與決策系統。
這場馬拉松主要測試的是前兩者:本體和小腦能力。在未來一到兩年內,小腦能力有望趨於標準化,核心的行走、跳躍、避障等功能將不再構成差異化競爭點。
到那時,真正拉開差距的,是硬體效能、製造成本和精度控制。而能否規模化落地,最終還是要看“大腦”這一層能否建立起來。
目前大腦系統正處於快速進化階段。比如Figure公司利用大模型能力推動系統迭代,僅一年估值就上漲了15倍,達到300億元人民幣。英偉達也剛剛開源了類似的整套智慧架構,這意味著行業的門檻正在快速被拉平,國內團隊有機會在幾乎同一起跑線上參與競爭。
我們判斷,在未來1到2年裡,機器人大腦將迎來一輪飛速提升期。即使是在過渡階段,也可以採用“傳統視覺+輕量規劃+任務排程”的組合策略,先落地一些實際應用,如商超巡檢、藥房配送、安防巡邏等,很多國內團隊已經開始部署。
同時,藉助資料訓練與模仿學習,也有望在重複性高的場景中實現區域性智慧能力的實際應用。
Nixon:諶威剛才這段關於“從小腦到大腦”的回應,也為我們的討論做了一個很好的收束。
總結一下,我們的判斷是:馬拉松可以幫助行業建立起“基本運動能力”的標準,而當“小腦”趨同之後,下一階段的比拼就將在“大腦”與場景適配之間展開。
*頭圖及封面圖來源於“ivy”。

