


作者 | 雲鵬
編輯 | 漠影
隨口說上一句話,機器人就可以為你倒一杯果汁、打一個雞蛋、將桌子上的碗筷準確放到收納架上,機器人還可以讀懂你的喜怒哀樂,頗具幽默感地給你講個小笑話。
今天,這些頗具科幻感的場景已經成為各路科技巨頭髮布機器人新品時的常見演示,AI大模型讓AI可以更好地看懂世界、理解世界並與人和世界產生更好的互動。
在大模型能力的快速迭代下,具身智慧已經成為當下機器人賽道聚光燈下的焦點,國內資本市場火爆,各路創企湧入,巨頭們也紛紛行動,電影中的大管家“賈維斯”,似乎正在向我們招手。
但相比釋出會上的“仰望星空”,機器人賽道顯然需要更多的腳踏實地,如何讓機器人能夠在更多場景中落地、實實在在地去服務企業和消費者、解決需求痛點,是更為實際的問題。
服務機器人市場作為機器人領域商用較為成熟的領域,正在具身智慧的發展下湧現出新的變數。
近日,有著豐富產品矩陣與落地場景的全球伺服器機器人巨頭擎朗智慧,再度釋出了一系列新品,並亮出了基於自身海量真實場景資料打造的具身多模態模型。

其人形具身服務機器人新品XMAN-R1,基於“崗位化、親和力、安全性”理念設計,已經具備了在服務行業中處理長程任務的理解規劃能力,成為業內關注的焦點。

▲XMAN-R1
擎朗自研的多模態模型正在幫助服務機器人一步步腳踏實地走向場景,解決更加複雜動態化的任務,具身智慧核心的泛化能力得到大幅提升。
其實早在去年的WAIC世界機器人大會上,擎朗就已經推出了XMAN-W3這樣的產品,在酒店機器人基礎上增加了靈活的雙臂,這也是擎朗在具身智慧領域的前瞻探索,這款可愛的XMAN-W3與XMAN-R1屬於同門同系師兄弟。

▲XMAN-W3
可以說,在具身智慧商業化落地方面,擎朗一直跑在前面。
毫無疑問,當下具身商用服務機器人市場正湧現出巨大機遇,而擎朗基於自身15年行業積澱,掏出從大模型技術、軟硬體工程化/產品化能力到技術商業化驗證三張王牌,已經向著具身商用服務機器人的藍海邁出了一大步。
01.
服務機器人規模化加速
泛化能力如何打破資料瓶頸?
根據市研機構IDC預測,未來全球具身智慧服務機器人市場將快速增長,五年後的2030年,市場規模或達到939億美元(約合人民幣6819億元),複合增長率達到86.2%。
具身智慧湧現出的巨大增長潛力,給商用服務機器人賽道的玩家們帶來了巨大動力,同時也帶來了新的挑戰。
近年來,服務機器人在餐飲配送、商用清潔、銀行導覽、酒店服務等領域已經形成規模化落地,在商超、文娛、醫療、康養等細分領域也展現出強勁的增長潛力。
與此同時,機器人面對的場景越來越複雜、非結構化,比如餐廳、醫院等場景充滿不確定性,突發情況較多、光線也十分複雜,人類可以依靠經驗快速調整,而傳統機器人則需依賴預程式設計規則與強化學習,效率低且難以覆蓋長尾場景。
具身智慧的核心在於“智慧體透過身體與環境的互動來學習”,正是當下行業痛點的良好解法,而這一過程也天然需要泛化能力。
服務行業需要有泛化能力的具身智慧機器人,需要具身智慧機器人“更聰明更懂人”,克服動態非結構化複雜環境、人與機器的高頻互動博弈、全流程閉環這三大挑戰,更好地解決實際生活中的問題。

但當前具身智慧的泛化面臨瓶頸。相對於多模態大模型可以利用網際網路文字、影像、影片、音訊等資料進行訓練,具身智慧大模型目前依然缺少可用於訓練的高質量、大規模人類操作資料。
正如擎朗CEO李通所說,對於具身智慧的發展來說,這是一個“先有雞還是先有蛋”的問題。
具體來講,具身智慧的資料來源包含遙操作採集(透過手柄、體感裝置等遙控機器人完成任務來採集資料)、生產伴隨採集(在真實環境中,人類操作員透過穿戴外骨骼等裝置,在實際生產中採集資料)、模擬資料合成(在高模擬3D環境中,實現機器人的資料採集)三個主要途徑。
根據不同的場景任務,綜合三種採集方式,可以顯著提高具身智慧體模型訓練效果,快速實現模型能力落地。
所以相比“一口吃個胖子”,放個吸睛感十足的“大招”,擎朗選擇了更腳踏實地真正可行的一條路,優先實現區域性泛化。
在擎朗看來,現階段直接實現完全泛化的具身智慧是幾乎不可能的,但透過單一任務泛化實現商業落地是可行的,讓機器人先專注於特定崗位場景,再逐步擴充套件其他崗位場景,最終融會貫通。
02.
軟硬體自研技術齊頭並進
具身服務機器人打出三張王牌
在這樣的理念加持下,擎朗在具身智慧風口找到了自己的準確方向,並率先交出了答卷,此次XMAN-R1的釋出以及自研垂類多模態大模型的深度融合,為擎朗在具身智慧服務機器人賽道按下了加速鍵。
具體到XMAN-R1,其核心的設計理念是崗位化、親和力、安全性。這三方面的關鍵特性可以說是具身智慧服務機器人落地的關鍵抓手。

在崗位化方面,XMAN-R1可以模擬崗位化姿態或崗位化行為模式,簡單來說,就是機器人可以學習人類服務人員的動作邏輯。
值得一提的是,“機器人崗位化”的概念是由擎朗首次提出的,直觀理解,就是將服務場景解構為標準化崗位單元,再將機器人定位為標準化的“崗位員工”。
比如一個機器人專門就負責快餐店的漢堡製作,一個機器人可以專門負責炸薯條的製作,而另一個負責打包收款結賬。
每一項工作內容都可以被精確描述,結果可以被標準化評估,這無疑更利於在商業環境形成機器人能力的閉環。
與此同時,透過不斷的複製“崗位化”工作模式,擎朗的人形具身服務機器人可以不斷學習和拓展多樣化工作能力,並持續迭代基礎動作模型能力,從而實現更廣泛的落地場景應用。
在另一個關鍵特性安全方面,XMAN-R1也可以說是黑科技武裝到牙齒。
其搭載了攝像頭、雷射雷達、深度相機等種類豐富的感測器,在演算法層面則採用了擎朗自研的即時空間三維重建技術。
各項技術加持下,機器人具備了很強的環境感知能力,能即時對環境中的靜、動態障礙物進行準確識別和未來行為預測,並透過雲端大腦對複雜任務進行多級規劃,最後結合本地小腦進行自適應運動控制,保障機器人的擬人化動作邏輯。
感控一體的全身運動規劃模型,可以在開放式複雜環境中確保人機協作和周邊人群安全。
這種雲端“大腦”任務理解+本地“小腦”運動規劃與控制的模式可以很好地兼顧效能、效率、功耗、成本等多方面因素。
在這背後,擎朗長期積累的海量開放場景語義資料和擎朗具身多模態模型的即時決策能力都發揮著關鍵作用。
在避障演算法領域,擎朗同樣有著深厚積累,截至2025年,擎朗智慧在避障領域已申請165件發明專利,據查詢,在服務機器人領域的授權發明專利數量上,擎朗在中國服務機器人行業居首位。
此外,在各類感測器原始資料處理、平衡效能與精度、降低時延、降低功耗等方面,擎朗也實現了諸多軟硬體技術層面的創新。
最後,在親和力方面,這次XMAN-R1的外觀更模擬人體比例,富有親和力的設計可以讓它更好地融入商業環境中,機身流暢精煉的線條可以兼顧科技感與力量感。
在這三大特性之外,擎朗自身服務機器人生態在協同性方面也湧現出巨大潛力。

在擎朗看來,人形具身服務機器人不是對現有產品的替代,而是對現有機器人生態的完善和升維,去解決服務行業的最後一環任務難題。人形具身服務機器人會與專用型具身服務機器人實行崗位化分工,融入整個擎朗的機器人服務生態。
從餐飲領域的配送機器人T10、酒店場景的服務機器人W3到清潔機器人C30、醫療領域的X101和工業領域的S100,人形具身服務機器人XMAN-R1將成為擎朗服務機器人生態矩陣的關鍵一環。

人形具身服務機器人具備較強的通用性和適應性,能夠執行復雜、非結構化的任務,可以與在特定任務上具備高效率和高精度的專用機器人形成很好地“互補”。
比如在餐廳中,XMAN-R1可以獨立完成取酒倒酒、放置托盤等配餐動作,並透過機器間任務排程,將餐品交接給配送機器人T10,後者會按最優路徑送餐,最終完成服務閉環。

可以說,通用具身服務機器人與專用具身服務機器人的協同必然會是未來智慧機器人發展的重要方向之一,兩者的結合可以充分發揮各自的優勢,更高效、更靈活執行任務。
總體來看,從機器人的內在到外在,從各類自研軟硬體技術到機器人生態協同,從崗位化專用做到極致到泛用性的高效迭代,在具身服務機器人該怎麼做這件事上,擎朗已經趟出了一條切實可行的新路子。
03.
每天數億條資料、數千萬次人機互動
具身智慧商業化落地加速
面對具身智慧的火爆,所有機器人企業都面臨著新的機遇和挑戰。行業到底會如何發展?企業要如何抓住需求、快速迭代產品技術、拓展市場?
在擎朗看來,具身智慧的發展必然要先做好“專用”這一環,這也是具身服務機器人商業化落地的最佳路徑。
李通提到,通用人形機器人的未來是非常光明的,擎朗也非常認同這一方向,但當下資料不足已經成為行業的核心痛點。
只有先透過專用機器人創造場景入口,積累資料反哺技術,才能進一步迭代使得具身智慧可以拓展邊界,進而拉動更多專用裝置部署,形成良性的商業閉環。
從行業視角來看,擎朗的做法顯然有極高的參考價值,在各個領域打造一群“專家機器人”,透過高度崗位化的場景海量獲取高質量資料,快速迭代模型和演算法,不斷提升機器人的泛化能力。
最終,當無數細分領域的專家機器人的能力被匯聚起來,真正泛用、通用的人形具身智慧機器人,也就離我們不遠了。
未來,真正的“大管家”具身服務機器人,也許會由一個通用大模型作為大腦,而各類來自於各領域“專家”的優秀小模型則會讓機器人在處理各類任務時都能遊刃有餘、專業高效。

在與擎朗CEO李通的深入交流中我們感受到,擎朗對於通用具身智慧未來的發展是積極樂觀的。
從創業之初,擎朗就一直希望做能夠服務好企業和消費者的服務型機器人,在這條路上,不斷有新的技術湧現,從深度學習強化學習到如今的AI大模型、具身智慧,新的技術都會成為擎朗最佳化機器人體驗的利器。
在過去的15年裡,擎朗完成了專用服務機器人的產業化和商業化普及,成為全球最大的商用服務機器人企業。

▲擎朗智慧機器人生態矩陣
從餐飲、酒店到醫院等場景,擎朗累計部署了超過10萬臺配送、清潔等專用機器人,服務網路已經覆蓋了60多個國家和地區。
這樣深厚的積累,正是擎朗可以在具身智慧浪潮中快速跑在行業前列,能做好具身服務機器人的突出優勢之一。

十幾年的服務機器人行業經驗,讓擎朗積累了海量的服務場景資料,涵蓋餐飲、酒店、醫療、工業等場景。這些資料對於擎朗具身多模態模型的能力提升有著極大的促進作用。
透過各個場景的視覺、語音等多模態資料的訓練,使得擎朗的多模態大模型具有優秀的場景感知與任務理解能力,這正是其它機器人企業所不具備的。
正如李通所說,機器人不僅是效率工具,更是資料入口——擎朗智慧每天產生超數億條環境感知資料、數千萬次人機互動記錄,擁有全球最大的商用機器人場景資料來源。
“專用機器人的價值不僅是完成任務,更是為通用化提供資料。”

與此同時,十餘年來,擎朗對商業服務場景中的客戶需求、場景特點、互動方式等非常熟悉,擎朗會花大量的時間去了解客戶的整個流程的操作細節。
展望未來,AI大模型賦能繼續加速、多模態感知技術加速迭代,具身服務機器人加速走向“通用泛化”,機器人會透過模組化技能庫組合應對新任務,會像人類嬰兒一樣,透過感知運動經驗自主構建物理規律認知。
而已經實現全場景滲透、全品類佈局、全球化拓展,掌握技術、市場和模式多重優勢的擎朗,已經成為撕開萬億藍海市場的核心推手。
04.
結語:
服務機器人賽道掀起具身智慧浪潮
擎朗提前交卷
海量真實場景資料而來的具身多模態模型、軟硬體工程化/產品化能力、充足的技術商業化驗證,這三個關鍵優勢已經成為擎朗在具身智慧時代的最硬底牌。
此外,擎朗智慧保持著開放生態與尖端設計的能力,如今擎朗機器人已完成市面上多款熱門AI大模型的接入,並實現應用場景的成功落地;旗下機器人產品頻頻斬獲德國紅點獎、德國IF設計獎等世界級頂尖獎項。
當下商用服務機器人市場正處於技術革新的關鍵年,國產化替代加速、覆蓋場景加速擴充套件,具身智慧必將成為全球商用服務機器人的核心角逐焦點,AI將給服務機器人賽道帶來哪些新的變數,又有哪些產品將驚豔登場,我們拭目以待。

(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)
