最火熱的機器人,為什麼非得是“人形”的?

*本文為「三聯生活週刊」原創內容

新刊出爐!點選上圖,一鍵下單↑↑↑
人形機器人,來了
2025年過去幾個月,從宇樹科技的機器人登上春晚舞臺開始,一股前所未有的人形機器人熱潮襲來。在網上傳播的影片裡,機器人已經能像人一樣走路,跑步,甚至能翻跟斗,騎腳踏車。很多人都為技術的飛躍而歡呼,渴望以後能靠機器人給自己養老。但人形機器人實際上發展到什麼程度了?它與我們普通人的認知存在什麼偏差?機器人要走進千家萬戶,在技術、產業以及倫理問題上,還需要跨越哪些關口?
主筆|張從志

機器人熱潮何以到來?

2025年的央視蛇年春晚表演了46個節目,歷時4個半小時,但是,最後被大多數人記住的,不是相聲、小品,也不是魔術、曲藝,甚至不是當紅的歌手或者演員,而是一臺身高1.8米,體重47公斤,膚色黝黑,身著花棉襖,扭著秧歌,轉著手絹的人形機器人。它就是杭州宇樹科技有限公司生產的Unitree H1Unitree H1在春晚舞臺的亮相,在國內掀起了一場人形機器人熱潮。
Unitree H1在春晚舞臺的亮相,在國內掀起了一場人形機器人熱潮。
過去幾個月,各家公司推出的人形機器人都開始上陣,在影片裡展示各種絕技:跑步、翻跟頭、打拳,或者進廠打工、端茶倒水。這些影片在社交媒體上廣泛傳播,其中還夾雜著一些AI生成的虛擬內容,讓很多人對機器人的認知與現實產生了某種偏差。這種偏差有兩個極端:一個是認為我們很快就可以在家裡買臺機器人當保姆了;另一個則是相信,機器人仍然只是個鐵玩具,不會對我們的生活產生大的影響。
事實上,機器人技術的發展確實在加快。10多年前,隨著強化學習、模仿學習等AI技術的興起,人形機器人的研究正規化從傳統的機電控制逐漸向深度學習轉移。那個階段,美國機器人公司波士頓動力和谷歌等公司已經利用這些方法,讓機器人實現了很多過去難以實現的運動能力。以強化學習為例,其核心思想是透過獎勵的方式讓機器不斷試錯,從而找到最優策略。現在我們看到的很多機器人做出的酷炫動作,比如跳舞、翻跟頭,抓東西,大都用到了強化學習的技術。
更大的轉折點發生在2022年ChatGPT的橫空出世,大模型從此變成了人工智慧的主流技術路徑,計算機專家們甚至看到了通用人工智慧(AGI)實現的希望。而要實現AGI,很多人認為,光有大腦的智慧還不夠,還需要有身體的智慧。所以過去兩年,從AI的版圖裡分叉出了一個新的領域,那就是具身智慧(Embodied Intelligence)。最通俗來理解,具身智慧就是有身體的智慧,它強調智慧的來源包括智慧體的身體與周圍物理環境的互動,而不僅僅是發生在大腦層面,而具身智慧最佳的載體就是人形機器人。所以,發展人形機器人,成了推動AGI的必由之路。
在浙江省人形機器人創新中心,工程師正在對樣機進行除錯(蔡小川 攝)
大模型給機器人領域帶來的更深刻的變化,是指出了一條新的道路,那就是“端到端”(end to end)傳統的機器人學把機器人系統分為感知、決策、控制、執行四個模組,如今這種模組化的思路逐漸被“端到端”的架構取代。“端到端”,簡單來說,就是隻管輸入和輸出兩頭,而且只用輸入原始的資料,不需要對資料進行分割,中間怎麼運算則交給演算法來完成,最終機器會從海量的資料中識別出規律和特徵,從而得到正確的輸出結果。
在這期封面報道中,本刊記者採訪的加州大學洛杉磯分校工程學院教授丹尼斯·洪(Dennis Hong)提供了一段更加通俗的解釋:在前人工智慧時代,我們長期以來對機器人的操控是基於模型,它的原理其實不難理解:我們用數學和物理,把機器人的運動拆解成一堆方程式,然後輸入機器人的大腦。就像你給它一本操作手冊,告訴它什麼時候該邁哪隻腳、用多大力氣、身體往哪邊傾。飛機、汽車也都是這麼被控制的。這套方法的好處是可控——你知道它為什麼能動,也知道它出錯時錯在哪兒。但問題也很明顯:真實世界變化太多了,模型再精準,也總有想不到的地方。比如地板打滑、風吹、碰了一下桌角,機器人就容易‘蒙’。”現在,科學家可以不再給機器人操作手冊,而是讓它自己學。比如我們給它成千上萬段走路、轉身、上下坡的動作資料,它就能從裡面找出規律。你不用教它牛頓定律,它也能慢慢學會走得穩、站得住。這種方式叫‘端到端
如今,在機器人領域,越來越多人相信,透過大規模的資料採集、訓練,可以讓機器人學會舉一反三,從而適應複雜多變的物理環境和動態任務,成為真正的具身智慧機器人或者說通用人形機器人。
這對我們外行來說,是一條不太容易理解的技術演進之路,但其意義重大,也是當下這一輪人形機器人熱潮的實質所在。正是具身智慧的提出,把做傳統機器人研究的學者和工程師,與做大模型研究的AI專家們聚合起來,開始合力給人形機器人造出一個更加聰明的大腦和一個更加強壯、靈活的身體,讓它將來能夠在工廠、商場乃至家庭之中,幫人類承擔更多的工作。從業者們相信,機器人通往未來的路徑已經清晰,只等待突變點的到來。
這種信念正在將產業界、資本界的資源大規模引入人形機器人領域。自2022年以來,這個行業密整合立了一眾創業公司,融資金額不斷創新高。最新的紀錄是,一家成立僅僅50天,尚無任何公開產品的具身智慧公司,就拿到了8.7億元的投資。而不同行業的巨頭,如特斯拉、小米、小鵬、美的、螞蟻集團等等,要麼已經入局,要麼正在招兵買馬。
上海智元機器人的量產工廠內,工作人員正在對組裝好的“遠征 A2”號機器人進行檢查(蔡小川 攝)

為什麼要把機器人做成“人”的樣子?

人形機器人作為一種科幻想象有很長的歷史,但世界上第一臺真正意義上的人形機器人1973年誕生於日本,那是早稻田大學開發的一個叫做WABOT-1的機器人,它有雙足、雙臂,但看著非常簡陋,功能很少,走路都很困難。之後的幾十年裡,全世界各地推出了不同的人形機器人,在科學家和工程師們的努力下,它們開始學會用雙足行走,做一些簡單的抓取動作,甚至還能跟人聊上幾句,不過離我們的生活都還很遙遠。
後來,從機器人學中衍生出各種專用機器人,它們不追求人的形貌和能力,而是聚焦不同的場景和需求,比如工業機器人,以及後來的掃地機器人、送餐機器人、醫療機器人等,更快獲得了市場的認可。既然如此,為什麼一定要執著於造出像人這樣雙足、雙臂的機器人呢?
對於這種執著,研究者們可以給出一大堆理由。他們認為,人形機器人是機器與人類社會融合的最大公約數——它可以適應人類的各種生活環境,比如樓梯的高度、扶手的位置、門把手的位置、廚房操作檯的高度等。可以使用各種專為人類設計的工具(比如剪刀、扳手、鍵盤等),這就意味著,它可以幫人類做更多我們不想做的事情。此外,擬人化的外形,也更容易在情感上被我們接納。
3月24日,山東省煙臺高新區第二實驗幼兒園,一臺宇樹科技的 G1 人形機器人與兒童握手
但雙足加雙臂的結構,使得機器人本身就成為一個高度不穩定的系統。要讓它像人一樣協調地運動起來,比如最基本的走路、抓杯子,就把全世界的科學家難住了幾十年。這也造成人形機器人的研究在學術界是一個非常小眾的領域,在產業界則遲遲無法落地。
浙江大學控制科學與工程學院教授、機器人實驗室主任熊蓉和清華大學自動化系研究員、機器人控制實驗室主任趙明國,都是國內最早一批做人形機器人研究的學者,在這一領域紮根了20多年。他們也都曾被人勸過轉換研究方向。“從學術上來說,過去的機器人研究是一個投入產出比非常低的領域。同樣智力和能力的團隊,做其他領域可以更容易獲得很好的成果,但是做機器人就不容易,有大量的枯燥、乏味的工作要做,要動那麼多硬體,週期也長。很多聰明的人不願意做,這跟最近幾年的情況很不一樣。”趙明國說。
熊蓉則發現,到2018年前後,很多研究者轉向了別的領域,比如當時興起的建築機器人、醫療機器人等,在學校裡選這個方向的學生也比較少。因為缺少工程人員,在團隊裡做演算法研究的同學不得不肩負起檢修機器人的任務。
早年的機器人研究作為前沿技術獲得了國家科技專案經費的支援,這給很多學者的科研提供了支撐,後來,眼看出不來成果,很多專案都停掉了。
丹尼斯·洪教授在美國也同樣親歷了人形機器人從邊緣走到聚光燈下的過程。我缺少研究經費。我嘗試過向最大的研究資助機構美國自然科學基金會申請雙足機器人研究的經費,但沒有成功,申請研究輪式運動的方案則成功了,因為在資助者看來,這個技術的難度相對低,而且更實用,更有可能落地在搜尋和救援任務、自然探索和反恐行動當中,而雙足步行的應用場景還不明確。
日本從上世紀八九十年代以來就對人形機器人進行了重點投入,包括本田、豐田、索尼等公司在內,都推出過自己的產品。但後來,這些專案大都停止開發。誕生於美國麻省理工學院的機器人公司波士頓動力(Boston Dynamics),從2013推出人形機器人Atla後,不斷迭代,實現了讓人驚豔的運動能力,但還是因為無法真正落地實用,公司幾度易主——先是在2013年被Google收購,2017年又轉到日本軟銀集團旗下,2020年12月12日韓國現代汽車集團成為新東家。
2022年10月26日,波士頓動力公司執行長羅伯特·普萊特與他們推出的人形機器人Atlas在一起

我們準備好迎接機器人了嗎?

儘管具身智慧給人形機器人找出了新的道路,讓機器人的進化開始加速,但這個行業的發展仍處於早期,對未來趨勢的判斷也有不同觀點。有的技術專家給出了7-10年機器人就可以實現通用能力的判斷,有的則認為需要更長的時間。這是因為在機器人的大腦和本體層面,從業者之間都還存在技術路線的分歧。“端到端”的架構而言,雖然其上限很高,但也存在有“不可解釋性”的弊端,也就是人們常說的“黑箱”狀態。因為不知道資料輸入後,中間經歷了什麼樣的計算過程,科學家們也無法解釋機器人任務失敗的原因。
在大部分場景下,人們能夠容忍機器人犯一定的錯誤,但在某些場合下如果要求必須分析原因,找到解決辦法,這會變得很棘手。中國科學技術大學計算機科學與技術學院教授、機器人技術標準創新基地主任陳小平說,這對機器人的落地應用是一個阻礙。“訓的時候效果挺好,但用的時候又不好,不知道是怎麼回事,也不知道怎麼修改。有些使用者可能就覺得心理沒底,你到底要多少資料,你缺什麼樣的資料,這些都不明確,人家就很難配合你。”
而在資料的層面,到底需要需要什麼樣的資料,需要多大規模的資料,怎麼獲取這些資料,整個行業也分成了不同的流派。我們採訪了不同的創業公司,有的公司認為真機資料最重要。真機資料通常是人類操作員透過遙控或輔助機器人進行任務操作而採集到的資料。所以這些公司會把機器人送進工廠,或者建設集中的資料採集場,部署大量的操作人員和機器人來採集資料。還有的公司相信模擬資料是解決問題的核心。模擬資料是在計算機模型中模擬真實場景,對機器人進行虛擬訓練,最終得到的資料。
人形機器人發展如火如荼,大眾情緒也烘托至此。我們能感覺到已經身處在一輪技術鉅變的浪潮之中。但技術會把我們帶向何方,我們並不清楚,這種討論的聲音也十分微弱。雖然國家科技部、工業和資訊化部2019年就制定了《新一代人工智慧治理原則》,中國國家機器人標準化總體組委託北京大學出版了《中國機器人倫理標準化前瞻2019》,國內一些高校和機構近年來也在開闢關於人工智慧研究與治理的方向。但是,技術的演進和躍遷速度,往往迅速將專家們達成的原則、框架和共識甩在身後。
北京人形機器人創新中心有限公司推出的“天工”號機器人正在不同路面進行行走能力演示(蔡小川 攝)
人形機器人產業如今的發展,很大程度上還是基於技術和資本的邏輯,對於它可能帶來的失業問題、安全和倫理風險等,都缺乏與技術發展相匹配的研究和共識。技術界和產業界忙著攻克機器人的技術難關,佈局規模化生產能力,根本無暇顧及這些問題。而傳統的研究倫理的人文社科學者,則對發展越來越快,越來越艱深的智慧技術體系和產業缺乏深入的、足夠豐富的經驗,這對他們的研究和思考構成了阻礙。
本刊記者專訪了主導制定《中國機器人倫理標準化前瞻2019》的北京大學劉哲教授。他在北大組織開設的人工智慧、機器人與倫理課程,需要由五個院系的老師共同教授,而目前這樣的課程尚不多見。他說,人形機器人”的概念本身就值得反思,而伴隨機器人的智慧而來的自主性,已經給人類社會帶來多重倫理困境,需要更多的社會資源和注意力投入其中進行研究。
如果能夠實現所謂的通用能力,人形機器人將與人類歷史上的蒸汽機、汽車、計算機、手機等所有的單一技術或工具都不一樣,它會以具身方式進入人類的生產與生活場景,與我們直接進行物理的、乃至精神的接觸,甚至在很多場景下接替人類的決策者身份。這將直接衝擊人類的主體性地位,我們的道德經驗、倫理規範和法律準則,可能都需要重新調整。
著名的科幻小說家艾薩克·阿西莫夫20世紀40年代提出了機器人三原則
第一,機器人不得傷害人類,或坐視人類受到傷害;
第二,除非違背第一原則,機器人必須服從人類的命令;
第三,在不違背第一及第二原則下,機器人必須保護自己。
80年過去,社會和技術環境都發生了巨大變化,我們對這些機器人的認識似乎還沒有超越這些原則,但今天的我們,越來越接近科幻小說裡的情節。
2021年,特斯拉公開了Optimus人形機器人計劃,圖為虛擬場景
更多精彩報道詳見本期新刊
人形機器人,來了
點選下圖,一鍵下單
期更多精彩
| 封面故事 |
  • 人形機器人,來了(張從志
  • 人形機器人:進化何以加速?(張從志
  • 我經歷的“人形機器人”發展之路(覃思)
  • 五個關鍵的人形機器人(覃思)
  • 一個“90後”創業團隊的技術信仰與實踐(李曉潔
  • 機器人自主性的倫理困境(劉暢)
| 經濟 |
  • 市場分析:樓市開始企穩了嗎?(謝九)
| 社會 |
  • 時事:緬甸強震:動盪局勢下的救援難題(程靖 彭麗 楊純希)
  • 調查:23歲留學生在美遇害:危險的邊界(覃思)
  | 文化 |
  • 文化:重讀《駱駝祥子》(苗煒)
  • 文史:彭元瑞入館(卜鍵)
| 專欄 |
  • 邢海洋:貿易戰1.0到2.0的“悲喜劇”
  • 袁越:多功能腎
  • 張斌:劉美賢回到冰場
  • 朱德庸:大家都有病
點選下方圖片
開通數字刊會員年卡解鎖本期👇

本週新刊
 人形機器人,來了
點選圖片,一鍵下單紙刊!


相關文章