天才少年機器人登場,給葡萄縫針,騎腳踏車遛彎,還會抖腿偷懶

擁有更多情緒表達能力
作者|王磊
編輯|秦章勇
首個真正意義上具備複雜互動能力的機器人,出現了。
它的創造者就是此前從華為離職的天才少年——曾經帶著各種硬核DIY作品火遍全網的男人——稚暉君
3月11日,智元機器人聯合創始人稚暉君(彭志輝)釋出影片稱,這鴿了2年之後,第一次正兒八經地更新影片。
在影片中,他正式介紹了智元最新研發的雙足智慧互動人形機器人——靈犀 X2
除了常規的行走、跑、跳,X2還點滿了運動天賦,不僅能舉重蹲起,還能踩滑板車,甚至還能自己騎腳踏車。
01
有“人味兒”的機器人
作為 X1 的“全能小老弟”,靈犀X2同樣是由智元半年前成立的機器人實驗室 X-Lab 打造出來的,而且從X1到X2的研發,僅用了三個月。
和之前釋出的原型機器人X1一樣,X2全身一共28個自由度,體重為33.8千克,身高1.3米左右,當然,X2的本體設計還新加入了大量的技術創新思考。
比如,重新設計的機電關節模組,在全身28個的自由度中,沒有使用到任何一個並聯結構,這就意味著能實現傳動鏈的完全解耦
X2 還將機器人的硬體系統抽象為一系列可複用的核心元件,包括小腦控制器 Xyber-Edge、域控制器 Xyber-DCU、智慧電源管理系統 Xyber-8MS,以及經過“茫茫多”迭代的核心關鍵模組 Power Flow 等。
也就是說,透過這樣模組化的元件設計,就可以像透過飛控,攢一臺無人機航模一樣,快速搭建起各種形態的人形機器人系統,這也是為什麼X1原型機到X2研發這麼快的原因之一。
在稚暉君看來,機器人並非一定是鋼筋鐵骨,因此他們嘗試了大量的柔和材料,像TPU、ETPU、EVA 等多種材料,他們甚至考慮了用美妝蛋作為機器人的材料。
稚暉君表示,靈犀 X2 集三重角色於一身——不僅是一款支援高自由度、運動能力的雙足人形機器人,還是一款搭載情感計算引擎的智慧互動機器人,以及一款初步具備通用任務執行能力的具身機器人。
高自由度和任務執行能力都不難理解,其搭載的情感計算引擎,通俗的來講就是更有“人味兒”了。
稚暉君表示,當前足式機器人的運動控制已經全面從傳統的 Model based 轉向 Learning 驅動的強化學習。
透過結合深度強化學習和模仿學習演算法的優勢,X2 可以不斷的學習和進步,不僅學會了像人一樣自然的走路,還能流暢地跑步和轉彎,甚至還能跳科目三….
當然就像人一樣,在學習的過程難免也會學到“抽象”一些的東西,X2也不例外。
比如在訓練初期一不小心學“歪”了,有把跳躍當做平時移動方式的,還有一言不合就躺地上“擺爛”的,甚至還有被官方鑑定為“性格暴躁,愛跺腳”的另類機器人。。。
除了常規的行走,跑,跳外,為了偷懶,X2還能學會使用各種人類的懶人工具,比如踩滑板車,平衡車代步,甚至自己騎腳踏車
為了讓 X2 更有“人味兒”,智元團隊增添了不少細節,比如靈犀X2能模仿人類呼吸韻律、具備人類好奇心和注意力機制、會一些“抖腿”小動作的肢體語言等。
目前,X2 仍在不斷學習和進步。透過資料驅動的演算法正規化,智慧機器人能夠從每秒數萬次與環境的互動和動作資料中,找到克服動作限制的方法,稚暉君表示,我們相信人形機器人的運動智慧問題很快會得到徹底的解決。
02
能力進階
作為一款人形機器人,光四肢發達還不行,頭腦也不能簡單,互動智慧和作業生產必不可少。
在互動方面,藉助當前最火熱大語言模型技術,智元團隊還為 X2 訓練了定製的多模態互動大模型——矽光動語,從字面上,“光動語”分別代表著,視覺,動作,語音。
在這個大模型的加持下,靈犀X2也被稚暉君稱為“第一臺真正具備複雜互動能力的靈動機器人”
在此基礎上,透過邊緣側大腦和端到端模型架構,以及一系列工程最佳化,靈犀 X2 具備了毫秒級互動能力。
比如坐下聊天可以對答如流,面對“你是誰,你從哪來的,你存在的意義是什麼”的人生三問,X2 都能順暢回答。
當 X2 被問及它和狗同時掉水裡,應該先救誰,會毫不猶豫地回答道先救狗,“因為它需要幫助,自己沒事。”
最有意思的是,當稚暉君提問靈犀 X2“剛剛提的問有多少是預先寫好的”,X2的語氣還頗為得意,回答道“完全隨機”
基於 Diffusion 的生成式動作引擎,使得這款機器人不僅四肢協調,思維也頗為敏捷。
除了具備聽覺和語言的互動能力,基於 VLM 的矽光動語多模態模型還能讓 X2 透過視覺來理解和認識世界,識別眼前物體不在話下。
比如稚暉君拿出手機讓 X2 自己看現在幾點了,X2 能準確的回答出時間,還給睡不著的稚暉君推薦了牛奶,理由是有助於睡眠。
甚至還能真的“看到”物體上的小字,給稚暉君現場教學了一把。
情緒價值拉滿的同時,稚暉君表示“我們的終極期待,是希望機器人能夠成為構建社會生產力的重要分母”,也就是具備一定的生產能力。
據稚暉君介紹,過去一年裡,他們初步找到了一條通往泛化作業智慧的路徑,根據這些成果,他們也把操作智慧的能力也遷移到了 X2 上。
在本體層面,X2 的本體支援很好的柔性阻抗控制,可以裝配包括靈巧手在內的各種末端,使得其具備精細操作的能力,“針穿葡萄”的神技又重現江湖。
其次,在機器人的具身智慧方面,團隊也開源了業界最大之一的具身真機和模擬資料集。並提出了 RoboDual 的大小腦系統架構,以及剛剛釋出的 ViLLA 架構具身基座大模型「啟元」
這也使得 X2 初步具備簡單任務中對操作物體的零樣本泛化能力,並在某些任務中實現多機協作,比如相互充電。
在影片的最後,稚暉君作為靈犀X2親爹,像望子成龍一樣,給了它一個最終的期望,就是希望作業能力可以外溢到日常生活的方方面面,實現機器人的“吉祥三保”—
就是保安、保姆和保潔
03
神之一手
靈犀X2能夠擁有“情感”、能夠進行各類複雜任務,離不開智元機器人前一天釋出的具身基座模型 GO-1
GO-1 全稱 Genie Operator-1,GO-1的釋出,標誌著機器人從“單一任務工具”正式邁向“通用智慧體”
在工廠,它能靈活切換裝配、質檢、物流等工種;在家庭,它可以從整理玩具進階到輔導孩子作業;甚至在未來,機器人可能透過觀看教學影片,自主學會維修電器。
GO-1 的一大黑科技就是開創性地提出了 ViLLA(Vision-Language-Latent-Action)架構,其整合了“兩大模組”,三個“大腦”。
首先是多模態大模型(VLM),透過海量網際網路圖文資料訓練,賦予機器人通用場景感知和語言理解能力,可以將其稱之“視覺大腦”,靠刷遍全網圖文,學會認杯子、桌子、咖啡機,甚至能聽懂你喊“給我整杯82年的拉菲”。
另外還有專家混合模組(MoE),這其中又包含兩個關鍵元件:
首先是規劃層面上,隱式規劃器(Latent Planner)生成任務鏈,最佳化任務執行流程,利用跨本體和人類操作影片資料,學習通用的動作理解能力,可以將其稱之為“動作大腦”
比如,可以將複雜任務分解為一系列可執行的子任務。以 “掛衣服” 為例,機器人需分解為抓取衣架、調整角度等步驟,並根據實際情況靈活調整執行順序和引數,確保任務的高效完成。
另外,就是“摳細節小能手”(Action Expert),在執行層面上,基於百萬級真機資料生成精細動作序列,使靈犀 X2 的動作更加流暢、精準。例如,在倒水任務中,誤差可控制在 ±3ml 內,滿足日常生活和工業生產的高精度操作需求。
這幾個部分協同工作,使模型能夠透過人類影片進行小樣本學習,並快速泛化到新任務和新環境中,實操證明,這套架構下的能力確實不錯。
在五項複雜度不同的任務測試中,GO-1 的平均成功率較現有最優模型從46%提升到了78%,尤其在倒水、清理桌面和補充飲料等任務場景中表現突出。
更為關鍵的是它的進化速度,GO-1支援跨本體資料共享,這意味著每臺機器人的經驗都能反哺系統。假設一個機器人學會擰螺絲,那麼其他機器人立刻能同步技能。
智元機器人也計劃年內推出基於強化學習的Foundation Model,進一步釋放機器人的自主決策潛力。
按照他們的設想,五年內要讓機器人走進客廳,或許用不了多久當你推開家門,迎接你的將是一個正在忙碌的機器人了。
>End
>>>                        
本文轉載自“超電實驗室”,原標題《天才少年機器人登場,給葡萄縫針,騎腳踏車遛彎,還會抖腿偷懶》。
為分享前沿資訊及有價值的觀點,太空與網路微信公眾號轉載此文,並經過編輯。
未按照規範轉載及引用者,我們保留追究相應責任的權利
部分圖片難以找到原始出處,故文中未加以標註,如若侵犯了您的權益,請第一時間聯絡我們。
>>>   
充滿激情的新時代,
充滿挑戰的新疆域,
與踔厲奮發的引領者,
卓爾不群的企業家,
一起開拓,
一起體驗,
一起感悟,
共同打造更真品質,
共同實現更高價值,
共同見證商業航天更大的跨越!
——《太空與網路》,觀察,記錄,傳播,引領。
>>>                                           
·《衛星與網路》編輯委員會
高階顧問:王國玉、劉程、童旭東、相振華、王志義、楊烈
· 《衛星與網路》創始人:劉雨菲
·《衛星與網路》副社長:王俊峰
· 微信公眾號(ID:satnetdy)團隊
編輯:豔玲、哈玫,周泳、邱莉、黃榕、娜娜
主筆記者:李剛、魏興、張雪松、霍劍、樂瑜稻子、趙棟
策劃部:楊豔、若㼆、李真子
視覺總監:董濘
專業攝影:馮小京、宋偉
設計部:顧錳、潘希峎、楊小明
行政部:姜河、林紫
業務部:王錦熙、瑾怡
原創文章轉載授權、轉載文章侵權、投稿等事宜,請加微信:15910858067
商務合作;展覽展廳設計、企業VI/CI及室內設計、企業文化建設及品牌推廣;企業口碑傳播及整體營銷傳播等,請加微信:13811260603

雜誌訂閱,請加微信:

wangxiaoyu9960

· 衛星與網路各分部:
成都分部負責人:沈淮
長沙分部負責人:賓鴻浦
西安分部負責人:郭朝暉
青島分部負責人:江偉
· 衛星與網路總部負責人:農燕
· 會議活動部負責人喬顥益、許克新、董今福
· 投融資及戰略層面合作:劉雨菲
· 本平臺簽約設計公司:一畫開天(北京)文化創意設計有限公司
· 航天加(深圳)股權投資基金管理負責人:楊豔

相關文章