


作者 | 程茜
編輯 | 心緣
稚暉君的人形機器人又雙叒叕進化了!
智東西3月11日報道,今天,智元機器人正式釋出最新全能探索機器人“團寵”——靈犀X2,智元機器人創始人兼CTO稚暉君稱,X2集運動、互動、作業能力為一體,是第一臺真正具備複雜互動能力的靈動機器人。
X2體重33.8千克,全身28個自由度。靈犀X2的命名寄予了他們對機器人的憧憬:希望它既靈動又犀利。

這一新“團寵”集三大能力為一體:支援高自由度運動能力的雙足人形機器人、搭載情感計算引擎的智慧互動機器人、初步具備通用任務執行能力的具身機器人。
X2在運動方面,能騎平衡車、滑板車、腳踏車;互動方面,可以基於動作、視覺、語音模型和人類即時自然交流;作業能力方面,擁有簡單任務的泛化能力。
值得一提的是,為了讓機器人更像人,X2整合的多模態互動大模型矽光動語中的動作模組,還讓其擁有了仿人的小動作,比如坐在椅子上晃腳、走路擺手等。

作為B站百萬up主,這也是稚暉君時隔兩年的首次重磅更新,他特意錄製了12分10秒的影片將X2從裡到外介紹了個清楚。X2的研發耗時三個月,這條影片準備時間長達一個月。
稚暉君影片B站播放量已超66萬。評論區的網友,一邊感慨看到了未來家用機器人的雛形、民用機器人真正實用發展方向,並預言這款機器人“已經可以大賣了”,另一邊有人在感慨“這種機器人大規模發展了,人類該怎麼辦”。


4月1-2日,智東西聯合主辦的2025中國生成式AI大會(北京站)將舉行。20+位嘉賓/企業已確認,將圍繞DeepSeek、大模型與推理模型、具身智慧、AI智慧體與GenAI應用帶來分享和討論。更多嘉賓陸續揭曉。歡迎報名~
01.
像搭積木一樣攢硬體系統
讓機器人不再“鋼筋鐵骨”
研發人員在靈犀X2的本體設計上下足了功夫。
首先來看硬體系統,智元機器人的研發人員讓其變得像搭積木一樣簡單。
他們將機器人的硬體系統抽象成一系列可複製的核心元件,包括小腦控制器Xyber-Edge、域控制器Xyber-DCU、智慧電源管理系統Xyber-BMS、核心關節模組Powerflow。

就像無人機愛好者們透過整合飛行控制器這一核心元件,自主組裝或定製具備高智慧化、自動化功能的無人機系統,開發者也能用這些核心元件快速搭建起一套可靠的人形機器人系統,或者各種形態的人形機器人系統,甚至是稚暉君一直鴿的“哪吒完全體”。

其次是機體材料選擇,與此前鋼筋鐵骨的機器人不同,X2皮膚軟軟的。
據透露,他們為X2嘗試了TPU、ETPU、EVA等各種材料,這些材料通常被用於鞋底減震緩衝,甚至還嘗試了美妝蛋,最終選定了親和的柔性材料。

02.
全身關節仿人體串聯結構
訓練早期像小朋友學走路
讓人形機器人能自如運動,需要靈活的身體和強大的運控演算法。
X2的原型機全身自由度28個,在機電關節設計上採用串聯結構,沒有使用任何一個並聯結構,能同時保證慣量上移和傳動鏈完全解耦。

傳統機器人常採用多連桿並聯機構以增強剛度,但會增加機械耦合和控制難度。串聯結構是類似於人類骨骼結構的關節設計,可以降低機器人的整體重量。
硬體拉滿,運控演算法也要全面突破。
當前足式機器人的運動控制從傳統的model-based的方法轉向強化學習,結合深度強化學習和模仿學習演算法的優勢,X2能像人一樣走路、能跑、能轉或者跳一點小舞。
X2在影片裡跳起了短影片平臺熱門舞蹈“科目三”。

不過,X2前期的學習過程並不是一帆風順,稚暉君說:“教育小朋友總是需要一些耐心。”
訓練初期的X2學習跑偏實錄如下:
莫名奇妙學到了抽象的走路方式,像螃蟹一樣橫著走、跳著往後蹦。

或者像小朋友一樣一言不合躺地上耍賴。

甚至還有情緒激動 ,愛跺腳的機器人。

影片還展示了拿著塑膠槓鈴鍛鍊的X2。

最後,X2總算苦盡甘來,擁有了更強的運動智慧水平——學會使用“懶人工具”。點滿運動天賦的X2,學會了騎滑板車、平衡車。

甚至是難度更高的騎腳踏車:

這種資料驅動的演算法正規化,使得智慧體能從每秒數萬次的環境互動和動作資料中突破運動智慧的瓶頸。
03.
多模態互動大模型矽光動語
首臺具備複雜互動能力靈動機器人
雖然X2四肢發達,頭腦也並不簡單。
研究人員為其開發了一套基於Diffusion的生成式動作引擎,讓X2擁有了和人自然互動的能力。藉助大語言模型,其為X2訓練了定製的多模態互動大模型矽光動語,光就是視覺、動是動作、語是語音,稚暉君說,X2是第一臺真正具備複雜互動能力的靈動機器人。
透過邊緣側大腦端到端的模型架構以及大量工程最佳化,X2擁有毫秒級互動反應,能透過人類的面部表情和語音語調精準判斷情感狀態,並做出相應的回應。稚暉君演示了一個神奇的“自己”和自己對話的景象。X2使用稚暉君聲音進行訓練,和他談論了看電影、掉河裡該救誰的世紀難題等。
影片中,X2能自如聊天,接話時幾乎沒有延遲,講話時手部還會有相應動作,在問到“這些問題有哪些是預先設定的”,X2給出了“完全隨機”的回答。
基於多模態互動大模型矽光動語,X2可以透過視覺理解和認識世界。當稚暉君舉起X2的胳膊放到機器人面前時,它準確識別出了自己的胳膊還有材質。
它還能準確說出手機上的時間、識別出萬用表、讀出包裝盒上的使用說明書等。
矽光動語整合的動作模態,讓X2有了“生命感”,它像人一樣擁有了呼吸的韻律、好奇心、注意力機制,還會在走路時伴隨一些仿人的小動作。

甚至在人機互動方面,X2可以與使用者進行遠端裸眼3D交流。

目前,智元機器人正在完善X2的思維模型,結合矽光動語大模型,將Reaction-Agent作為情感計算引擎,未來賦予機器人更多情緒表達的能力。
04.
簡單任務能零樣本泛化
讓機器人入職“吉祥三保”
一個完美的機械夥伴,除了情緒價值,還需要泛化作業的能力。
研究人員將操作智慧的能力遷移到X2上,其本體支援柔性阻抗控制,能裝配包括靈巧手在內的末端。

X2完成精細操作也不在話下,上演了“葡萄穿針”的絕活。

具身智慧方面,智元機器人開源了業界最大的具身真機和模擬資料集之一,提出RoboDual的大小腦系統架構以及基於ViLLA架構的基座大模型啟元。
透過一腦多形的“啟元”大模型,X2初步具備簡單任務對操作物體的零樣本泛化能力,例如從貨架上取物品:

X2還能可在某些任務中實現多機協作,比如給同伴充電:

稚暉君談道,這使得機器人的能力可以外溢到日常生活的方方面面實現機器人的“吉祥三保”,即保安、保姆、保潔,同步應用於教育、醫療等多個領域。
同時,靈犀X2採用輕量化設計,可模組化拓展,擁有完備的二次開發介面,以及預訓練模型和“採-訓-推”一站式方案,使用者可根據需求自由探索,為康養、服務、家庭陪伴等各類場景打造應用,實現“人形機器人人人玩”。
05.
結語:X2展現家用機器人的實用主義雛形
儘管從人形機器人的各項能力來看,X2並不是最頂尖的,但其展現出的已有能力正是未來人形機器人走入家庭,或者走入各行各業需要具備的基本能力。
不論從硬體系統、軟體演算法還是關節結構來看,智元機器人都考慮到了人形機器人大規模落地普及的趨勢。
未來,基於人形機器人在運動、作業和互動方面的能力,或許可以在不同場景透過模組化設計,讓人形機器人深入陪伴、教育、清潔等諸多場景。


(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)
