作者:朱秋雨 賴丁萌
來源:鹽財經ID:nfc-yancaijing
中國人形機器人賽道最近“好訊息”不斷。
前有深圳的眾擎機器人完成全球首例前空翻,後有杭州宇樹科技機器人實現720度迴旋踢。3月11日,前華為天才少年“智暉君”創立的智元機器人,釋出了人形機器人靈犀X2。在影片裡,機器人不僅可以像人一樣走路、跑步,還能玩滑板車、騎腳踏車。
人們正通向“機器人養老”的美好願景,而現在,一個新工種隨著具身機器人的火爆而出現。在Boss直聘、實習僧等求職APP上,一些公司正招聘學歷要求大專以上,名叫“機器人資料採集員”的崗位。
●在Boss直聘等求職APP上,一些公司正招聘“機器人資料採集員”的崗位
這份工作的主要內容包括:負責機器人資料採集工作、控制機器人正確移動、保護機器人處於安全狀態,等等。
除此以外,很多崗位還列出了對人的外形的要求,有的是,“不戴眼鏡,沒有高度近視”;有的要求“男生身高170-175,體重65公斤以內;女生160-168,體重55公斤內”;還有的公司要求,“不能有小肚子,身體協調性較好,細心、靈活、有控制力”。
這些崗位成功引起了眾人的注意。人們不禁好奇:機器人的資料採集員,會是一份什麼樣的工作?這個問題的答案,關係到了人形機器人的技術路徑和當下的阻礙。更本質的問題是,機器人實現智慧的背後,會像AI倚賴資料標註一樣,“有多少人工就有多少智慧”嗎?

重複性新工作
薪資100元-240元/天,在社交媒體上,關於機器人資料採集員的兼職、全職工作正在火熱招聘中。
上海的“90後”張謙看到了這樣的趨勢,近半年來一直在給“資料採集崗”投遞簡歷。事實上,她在一家經濟貿易公司有全職工作,但在AI浪潮下,她愈發感到危機降臨,想轉行到一個代表未來的行業。

● 2025年央視春晚,一群身披花襖的機器人扭著秧歌登上舞臺
具身機器人賽道就是她瞄準的方向,而資料採集員就是其中最簡單的跳板。“門檻低,這是我投資料採集員最主要的原因。畢竟AI等未來產業,許多崗位都是招工程師,對程式碼或硬體知識有一定要求。”她說。
她同時感到這類工作是有趣的。“有些資料採集工作會模擬真實作業環境。資料採集員穿動捕服,戴VR眼鏡第一視角模擬機器人完成任務。感覺很像遊戲。”只是,投遞了多份簡歷後,她仍未收到一份有效回覆,轉行之夢離她仍有些遙遠。
而正如張謙所感受的,機器人資料採集崗的工作內容,與遊戲3D動畫有相似之處。多位業內人士透露,訓練機器人時,他們都運用了與遊戲3D相似的動作捕捉技術。
所謂的動作捕捉,即透過人類穿戴各種裝置,測量、跟蹤、記錄人的運動軌跡,再經過計算機處理,得到三維空間座標的資料。當資料被計算機識別後,人體3D技術可以應用在動畫製作、步態分析,生物力學、人機工程等各個領域。
事實上,業內人士都清楚,這波資料採集員的招聘熱,最早是由全球頂尖機器人公司帶動的。2024年8月,特斯拉率先為旗下Optimus人形機器人招募資料採集操作員(Data Collection Operator)。據介紹,其工作內容為穿戴動作捕捉服和 VR 頭盔,每天沿著測試路線行走7小時以上,身上同時攜帶最多30磅(13.61千克)的重物。
與此同時,該崗位還要求採集員身高在170-180釐米之間,因為該職位需要穿上特製動捕服,身材要與機器人相似。採集員需要穿戴裝置,在工作過程中站立、坐下、行走、彎腰、伸展、蹲伏和扭轉身體。
特斯拉還給這群資料採集員提供了有競爭力的薪酬:每小時25-48 美元(約人民幣 180-342元),以及股權刺激。
相似的大型招聘同時在上海開啟。2024年6月,智元機器人在上海建立了一座面積3000平方米的數採工廠。公開影片顯示,在這個工廠裡,人需要透過在胸前佩戴VR裝置等進行資料採集,比如,人佩戴裝置教機器人疊衣服。
智元機器人具身產品線總裁姚卯青對媒體介紹,數採廠模擬了家庭、零售、服務業、餐飲、工廠的五個場景,未來將源源不斷為機器人學習提供資料養料。去年數採工廠僅投入使用兩個多月,就採集了超百萬量級真機資料集。
“不久後我們將擁有超千萬條資料。”姚卯青笑著對媒體介紹道。
從大廠的爭相佈局和落地來看,真實資料正成為機器人行業的一道門檻。唯一的問題是,機器人資料採集員門檻究竟高嗎?

●圖源:諾亦騰官網
記者以求職者身份,試圖聯絡多個招聘機器人資料採集員的科技公司。
來自深圳某科技公司的招聘經理張女士表示,資料採集員多數是臨時性的崗位,“我們有較大資料需求才會招人”。
“我們一般招的是大專生,或者外包的臨時工,做的是短期一兩個月的工作。”
據她介紹,機器人資料採集工作技術難度不算高,每天,採集員需要穿上一套裝置,重複性地做某類任務。比如,為了訓練機器人學習拿礦泉水,採集員需要在桌子前反覆完成拿礦泉水的動作,“如果資料需求大的話,可能一個星期都要重複做這一個動作”。
“當然,這個工作崗位也是有一定門檻的。”張女士說。
“倒不是技術專業背景的門檻,我們想要比較聽話、(身體)靈活的人。”

人類老師的重要性
資料採集員的招聘一定程度上反映了機器人行業的變化。國內動作捕捉廠商、NOKOV度量動捕負責人透露,近兩年,隨著人形機器人為代表的具身智慧在國內火熱,機器人產業對動作捕捉的裝置需求也隨之大增。
為什麼是近兩年的需求增長?該負責人介紹,這是因為人形機器人要求精度更高的人體運動資料。相比於電腦模擬的理想模擬環境而言,由人採集回來的真實資料,可以相容更多的隨機性和意外。
舉個例子,他說,機器人在遇見凹凸不平的地面時,因為機械機構的原因,很容易摔倒。但是,如果是人在面對一些崎嶇地面或者突發狀況時,人體本身可以自適應,很快能自己調節過來。
機器人資深從業者、北京某高校學者孔博士也稱,機器人行業對真實資料的需求,是隨著這兩年AI大模型技術的發展而興。一個典型標杆是特斯拉人型機器人的Optimus,採用端到端的技術,試圖透過給機器人喂大量的資料,從而訓練出具有通用能力的機器人。

●有新聞表示特斯拉的人形機器人利用 Xsens 動作捕捉系統進行訓練/圖源:Youtube
此外,Transformer架構、VLA(Vision-Language-Action)的發展和應用,讓機器人行業對資料的要求又增加了,如今,業界亟需精度高、質量佳的資料。
當下,來自業界一個共識是,“人類老師”對機器人的能力增長必不可少。上海通用機器人公司傅利葉生態拓展負責人周斌透露,人類採集的資料可以反映真實世界的複雜性。比如在訓練機器人時,周斌說,他們會首先運用模擬資料進行預訓練和初調;接著,再使用人類採集的高質量資料,進行多次精調,“這樣可以確保部署到真實物理世界的效能和效果”。
這一過程,智元具身研究中心常務主任廣輝也曾打過一個形象的比方。他以學習乒乓球為例,一般我們要透過圖文、看別人打球或看比賽等方式,先了解基礎或理論,再去訓練場透過發球機或者和別人打球簡單模擬。“如果要有更高要求,還要找教練一對一手把手教學。”
總的來說,人類老師就是機器人的“一對一教練”。一對一教學的最終目的,是為了讓機器人更像人類。

不可或缺的“上肢”力量
除了確保與真實世界相符,機器人的“一對一教練”還有一個更重要的功能。孔博稱,目前機器人行業一個最大的難點是上肢力量。
相比於人類教學,當前行業內還有一個更主流的方向,叫強化學習。這是一種在模擬環境下透過試錯(Trial and Error),讓機器人學習做出最優決策的方式。
他舉例:“通俗的理解,強化學習就像喂一個小狗,這個小狗它做對了,我就獎勵它,他做錯了,我就懲罰他。強化學習本質就是一個獎勵函式。”
這一獎勵最佳路徑的方式,如今被發現能較好地訓練機器人走路、跑動等運動自平衡能力。孔博將其形容為機器人的“下肢力量”,他稱,業內主流的宇樹科技等公司,都是運用強化學習訓練的。
“但現在人形機器人最讓人期待的使用上肢,去幹具體的事,”孔博表示,“它不應僅僅是個玩具,它要成為一個生產力,去工廠幹活,去商店買東西,最終進入家庭,成為機器人保姆。這裡的關鍵是在上肢。”

●圖源:Figure 機器人官網
不過,與公眾的期待仍有差距的是,孔博說,在實踐中,訓練機器人的上肢比下肢要難得多。而且,上肢訓練在模擬環境下,透過強化學習訓練得到的效果較差。
因此,多數機器人公司需要透過動作捕捉、遙操作等方式,讓機器人觀察人類演示後,遷移到自己本體上(尤其是上肢動作)去執行任務。這在機器人行業內,叫做模仿學習。
國內專注於機械臂和機器人本體的廣東某機器人技術總監稱,機器人獲取“上肢”力量之所以難,其實是難在機器人的“控制”端。
相比於移動、平衡小腦等類似於人類小腦的功能,機器人“大腦”控制端需要面對各類複雜的物理場景。這很難透過獎勵函式,在模擬環境中大規模訓練就可以得到好的效果。
他舉例,即使是簡單地使用機械臂,實施抓取動作,也面臨著複雜的狀況。“理想的模擬環境都是存在系統誤差的。(例如)在真實世界裡,機械臂在運動過程中,會因為重力因素存在抖動狀況。這些誤差怎麼去模擬出來,這是一個難題。”
因此,在操作端,該技術總監表示,還是人類在真實場景下進行資料採集,手把手教學的效果最好。“真實的資料是最直觀的,雖然在目前的成本是最高的,但是在訓練大模型時候,效果是最好的,也更容易進行引數調優。”他說。
與此同時,他強調,人工採集資料,不僅是簡單的採集,還包括上游的環境搭建、下游對資料的清洗和稽核,這些步驟都需要大量的人力。
從這個角度而言,機器人行業也屬於“有多少人工,就有多少智慧”的勞動密集型工作。

資料爭霸
從招聘APP的熱門崗位可以看出來,機器人行業正在經歷與AI一樣的資料“危機”——在AI行業裡,資料被稱為石油。OpenAI公司聯合創始人兼前首席科學家伊利亞·蘇茨克維爾2024年曾公開警告,“AI的訓練資料如同化石燃料一樣面臨著耗盡的危機”。
傅利葉負責人周斌表示,“真實場景下的機器人動作資料在行業內一直是個瓶頸,因為它的採集成本非常高,很多資料的標註精度也不夠。高質量資料的缺失,是制約機器人發展的一個主要卡點。”
相較於自動駕駛而言,周斌介紹,機器人行業對資料的需求和要求也高得多。“就像特斯拉的自動駕駛技術,需要有海量的資料才能訓練出來。但汽車需要控制的變數其實並不多,無非是加速、減速,轉向。”
相比之下,周斌說,人型機器人至少有三四十個自由度的資料輸出,“它背後的資料集的需求非常巨大”。
與此同時,在AI大模型的浪潮下,如今機器人行業迎來了全新的目標——追求通用性。孔博稱,機器人行業一直以來很難突破的地方是,機器人只能完成特定場景下的特定任務。

● 特斯拉Optimus Gen3
“過去的技術一直只適用於固定的結構化場景,它的位置姿態都是固定的。”孔博介紹,“比如,一個立方體在桌子上,機器人可以去抓取。但是如果讓它去拿一個水果,或者擇菜,他就搞不了。”
大模型和具身智慧火了後,上述多家機器人公司負責人透露,他們追求的是讓機器人具有泛化性,意思就是,機器人可以同時完成多種任務,適用於多種場景。這就需要機器人擁有認知物理世界的“智慧”大腦。
而形成智慧的關鍵,首先依賴大量高質量的資料,對機器人的AI演算法進行訓練。
不過,多位業內人士也承認,目前在機器人的資料上,仍存在許多不確定的因素。比如,當前各家機器人公司的形態、技術路徑都不一樣,導致了採集的資料形態不一,很難實現通用。
此外,真實世界因為存在過多的變數,例如光照因素、物理因素等等影響,需要採集的資料量也變得無窮大。而對於採集大量資料後,機器人能否擁有預想中的泛化性和通用性,目前還是未知數。
“目前來說大家都傾向於相信(具身智慧)這個方向可以,但是究竟能不能行,目前還是有待觀察。”孔博士總結。相比於AI,多重學科交叉的機器人還處在產業爆發的初期,前方仍有很多不確定性。
而當下,處在爆發期的機器人行業,也逐漸形成共識:各企業共同打造開放共建的生態,推動機器人資料共享。3月12日,智元機器人攜手上海人工智慧實驗室、國家地方共建人形機器人創新中心等機構,釋出全球百萬真機資料集開源專案 AgiBot World。3月17日,傅立葉也正式開源全尺寸人形機器人資料集Fourier ActionNet。
“如何解決資料(緊缺)的問題,我們認為首先需要一個更加開放共建行業的生態。”周斌總結道,“這不是說是一家公司能夠實現的,應該由企業、研究機構共同努力,參與資料的貢獻與演算法的最佳化。”
可以肯定的是,真實的人類動作資料正在被機器人企業所珍視,成為未來一大段時間的“石油”。眾多機器人企業也將依靠著一名名“大專生”,一遍遍完成最簡單的人類行為,等待機器人行業的ChatGPT時刻降臨。
(應受訪物件要求,文中張謙、孔博為化名)




