晚點對話梅卡曼德邵天蘭:通用機器人的吹牛競賽和現實路徑丨具身智慧對話#9

梅卡曼德機器人創始人 邵天蘭
“太多人關注終局,更重要的是路徑和速度。”
文丨程曼祺
編輯丨宋瑋
這是《晚點 LatePost》 「具身智慧對話」系列的第 9 篇。該系列將持續訪談智慧機器人和自動駕駛產業鏈頭部公司。往期文章見文末合集#具身智慧對話。
AlphaGo 用神之一手戰勝李世石的 7 個月後,圍棋愛好者邵天蘭從德國歸國創業,成立梅卡曼德(Mech-Mind)機器人。
換算到 2023 年的 AI 熱潮裡,這是一個典型的技術 “少年天才”:清華本科畢業、德國慕尼黑工大機器人方向深造,在德國參與過機器人創業公司;回國創業時不過 27 歲,相當於 2023 年的 “95 後”。
而經過 8 年真實場景的摔打,拿過紅杉、IDG、美團、啟明、英特爾等頭部機構融資的邵天蘭現在說,“自己是搬磚的人”。
梅卡曼德的 3D 高精度相機和與之配合的感知、規劃演算法已進入上千個場景:既在金庫碼錢,也在磚廠搬磚,能檢測汽車電池,也給浴缸鑽孔,碼放 5800 元一箱的五糧液。
他們的客戶有上汽、蔚小理、豐田、寧德時代、美的、格力、富士康等,涵蓋汽車、物流、金屬加工、家電、3C、鋰電、光伏等十幾個不同行業。
梅卡曼德應用場景的部分例項。
自 2020 年以來,據睿工業資料,梅卡曼德一直是中國 3D 視覺引導機器人市場第一名,市佔率接近 40%。
2023 年的大語言模型帶火了 AI 與機器人結合的 “具身智慧” 賽道,通用機器人尤其是人形機器人領域誕生一批新公司,它們成立時就以更通用的前沿具身技術為目標。
已有數年工業、物流場景落地經驗的邵天蘭有觀察這輪熱潮的不同視角。
他看到機器人的一些進展被過分高估、Hype 瀰漫行業,帶來 “吹牛競賽”:“創業公司必須不斷誇張宣傳,才能融到資;學界也要不斷誇大工作效果才能發論文。”
不少人形機器人公司把工廠視為第一批試驗場,邵天蘭卻認為,人形機器人和大量工業生產場景本質上就不契合:
“用多臺人形機器人一起去抬一個幾百公斤的工件,就像坐著光速飛船去拳打外星人。”
他認為通用的不是機器人本體本身,而是核心元件——這包括移動、操作、感知和任務理解與規劃等基礎能力,它們能快速組合成適應不同場景的不同形態機器人。
當被問及具身智慧的終局價值分佈,他說這個問題本身沒那麼重要:“太多人關注終局,而更重要的是路徑和速度。”
在邵天蘭經歷的創業中,從 0 起步的公司,尤其是他們這類研發背景的年輕團隊,需要專注自己的擅長,先找到第一個 PMF(產品-市場匹配),做出完成度足夠高的產品,形成商業閉環:“一開始就講宏大技術敘事,要直接登月的創業公司極少成功。”
機器人是一個熱點潮起潮落的行業,邵天蘭說梅卡曼德一直追求的事很簡單:“讓機器人用起來。”
從影片到實機展示、再到規模應用,每一步的 Gap 都很大
晚點:今年春晚,宇樹人形機器人扭秧歌火出了圈。作為從業者,你怎麼看這個表演?
邵天蘭:我很喜歡這個節目,我認為宇樹是足式機器人裡進展最好的公司之一,敢在全國人民面前直播很不容易。
很多觀眾驚歎機器人能轉手帕、扔手帕——不過這些反而和具身智慧關係不大。宇樹自己也發了花絮,轉手帕是靠機器人手部定製的旋轉機構,拋接手帕是透過線的收放。
真正值得關注的是多臺機器人完成了踢腿等一連串動作,展現了很好的運動控制能力和穩定性。其實宇樹自己並沒有渲染拋手帕的技術,但大眾會有一些自發的 hype(炒作誇大)。
晚點:現在機器人領域的 “hype” 有多大?
邵天蘭:和七八年前的自動駕駛很像,現在很多機器人創業公司甚至部分學界研究者都會透過擺拍和剪輯做出看起來酷炫的影片,導致大眾高估了實際進展。
影片裡很多機器人已經能跑酷和自己做家務了,但到了線下展會和客戶現場,機器人展示的任務往往簡單很多,速度和成功率都不好,抖音上也能看到不少人去看機器人展會後大失所望的影片。
而且一些炒得很誇張的技術路線,比如一些很火的具身模型,沒人能復現它所宣稱的效果,這幾乎是行業裡公開的秘密。
從短鏡頭擺拍到一鏡到底的長影片,到線下實機連續展示,再到在客戶真實場景裡小規模執行、大規模執行,最後到成功的商業化,每一步的 gap 都很大。
這種炒作的一個不良後果是 “吹牛競賽”:創業公司必須不斷比其他公司更誇張地宣傳,才能融到資;甚至學術界也要不斷誇大工作效果才能發論文。
晚點:你認為這兩年,機器人和具身智慧領域的實際進展是什麼?
邵天蘭:一是運動控制上,強化學習和模擬訓練提升了四足、雙足這種多關節複雜機械結構的運動效能和穩定性,機器人能更順暢地行走甚至跳躍了。當然這離在現實環境長期、穩定執行還有很大提升空間。
二是 AI 大模型的發展:比如視覺語言多模態大模型與機器人結合,讓機器人能初步理解指令、看懂圖紙,完成多步驟複雜任務;而視覺語言動作模型(VLA,Visual-Language-Action Model)則讓機器人能完成疊衣服等複雜操作,有了初步進展。
三是一些核心器件效能明顯提升。包括我們自己做的高精度 3D 相機,以及機器人用的雷射雷達、關節電機等。
四是產業鏈成本降低,比如入門級多指手的價格已降到數萬元甚至更低。
晚點:為什麼你把這叫多指手?不是 “靈巧手” 嗎?
邵天蘭:因為它現在還不 “靈巧”。目前僅中國就有十幾家創業公司在做多指手,這個方向肯定會不斷進步,但在機械結構、感測器、控制演算法等方面都還比較初步,相比我們真的想要的 “靈巧”,進度條可能連 10% 都沒走到。
這也是一種語言汙染,等真正 “靈巧” 時再叫靈巧手也不遲,否則那時只能叫 “超級靈巧手”“究極靈巧手” 了。
晚點:那麼通用機器人的整體 “進度條” 現在走到了哪兒?
邵天蘭:整體成熟度類似十幾年前的自動駕駛,大家開始看到曙光,但不意味著 3、5 年、乃至 10 年內就能完全實現。
因為完全通用的機器人幾乎等價於 AGI:它能感知環境,能思考、有記憶,然後能自己做決策、完成一連串任務。機器人還有機械結構、感測器等硬體實體,它的實現難度會比軟體層的 AGI 更大。
通用的不是機器人本體,而是核心元件
晚點:梅卡曼德已成立 8 年,服務了很多工業、物流行業客戶;而 2023 年之後成立的一批新公司一開始就做通用機器人。它們雖然現在還沒有規模落地,但有投資人認為,梅卡曼德這類更早進入具體場景的公司未來會被這批直接做通用的公司覆蓋。你怎麼看這種想法?
邵天蘭:通用的本質首先是能適配多個不同行業和應用場景,極大地減少,甚至不需要定製化。
我們的產品現在既在車廠造車、也在銀行金庫裡搬錢、甚至也給浴缸鑽孔,服務了汽車、金屬加工、家電、3C、鋰電、光伏、物流等幾十個行業的上千家公司,覆蓋搬運、裝配、切割、焊接、塗膠、擰螺絲、質檢等很多工藝,而且是用標準化產品做到的。這說明當前的產品已經有不錯的通用性,而且還在快速拓展應用場景。
左上為發動機連桿無序上料,右上為物流場景透明膜包包裹抓取,左下為輪胎裝配,右下為汽車零部件上料。
第二,通用機器人不是說最後都長一個樣。通用的不是機器人本體,而是核心能力和元件。
這和電腦、手機,甚至汽車都不一樣。電腦、手機是處理虛擬任務的,汽車是在物理世界工作,但任務相對單一,就是從 A 到 B 運貨和運人;而機器人要幫助人完成物理世界裡的各種複雜任務,註定形態多樣。
我認為未來會像《機器人總動員》那樣:天上飛的、地上跑的、水裡遊的、牆上爬的;幫人們切鋼板、割草、洗泳池、掃地、擦窗、帶孩子的……什麼樣的機器人都有。
它們長得不一樣,但組成它們的核心模組是通用的——所有形態的機器人,本質上都可以拆解為移動、手的操作、視覺感知、複雜任務理解和規劃等基礎能力的組合。落到產業鏈裡,就是通用核心零部件來支援不同形態的機器人。
晚點:這是個 “拼積木” 的邏輯,梅卡曼德主攻的 “積木” 是什麼?
邵天蘭:我們現在專注做機器人的 “眼睛” 和 “大腦”,也就是高精度 3D 相機和機器人的感知、規劃、決策能力,這些能力透過標準化、簡單易用的軟體來交付給使用者,能適配不同行業和場景。
梅卡曼德高精度 3D 相機的點雲成像,可精確識別黑色物體、高反光物體等。
晚點:實際上有多標準化?你們現在去服務一個新客戶時要部署多長時間?
邵天蘭:現在部署和除錯我們自己的視覺感知系統,通常只要數小時到數天,這是算上了安裝和測試的總時間。因為我們用的都是標準化感測器和軟體套件,幾乎沒有定製了。
晚點:你怎麼定義 “機器人大腦”?它就等於你剛才說的 “感知 + 決策 + 規劃” 嗎?
邵天蘭:機器人大腦還需要有常識和推理能力,要能聽懂指令、看懂圖紙,自己想辦法完成任務目標。
大語言模型在給機器人加 “常識” 上很有幫助,比如讓機器人知道杯子是用來裝水的,平時放在桌上;現在大家在探索的世界模型,也會讓人機器人能具備物理世界的常識,比如能預判環境中其它運動物體的軌跡等等。
配合大語言模型,梅卡曼德的感知和軌控演算法可讓機器人聽懂自然語言指令,完成任務。
晚點:這些能力未來會是分開、分層的多個具身模型的組合,還是像自動駕駛一樣有整合為同一個端到端模型的趨勢?
邵天蘭:坦率說我不知道。長遠的技術路線很難判斷,我也不認為任何人對此的判斷準確度能超過拋一枚硬幣。端到端是一個可能的技術路線,但它不是魔法。現在一些人把 “端到端” 當做了咒語,彷彿唸了這句咒語就能自動解決很多問題。實際上進展遠沒有一些人宣稱的好,而且端到端也有大量的不同細分路線。
狹義人形機器人在工業場景沒有任何優勢
晚點:你們現在去工業、物流場景競標時,會遇到做人形機器人和通用機器人的新公司嗎?比如智元機器人 CTO 彭志輝曾告訴我們,工廠裡的 “PPT”,即抓取(Pick)、放置(Place)和轉運(Transfer)會是人形機器人最快落地的場景。
邵天蘭:暫時還沒遇到過。我認為現在在工廠的絕大部分生產場景裡,狹義的人形機器人沒有任何優勢。
從亨利·福特時代的流水線開始,工業生產邏輯就是分工細化,極致追求效率和可靠性。不管是看現狀還是看趨勢,在工廠裡做抓取、放置和轉運都不適合狹義的人形機器人。
比如要在工廠裡抓取或放置重物和大型工件,人形機器人的負載和臂展都比不上過載機器人,甚至根本無法完成任務。你可以想象一下——用多臺人形機器人一起去抬一個幾百公斤的工件,這會是個非常搞笑的畫面——就像坐著光速飛船去拳打外星人。
梅卡曼德產品配合機械臂在汽車工廠內上料車內門板,這個場景適合高載重大型機械臂。
如果是小型工件,人形機器人相比輕型機器臂、SCARA(Selective Compliance Assembly Robot Arm,一種特化的機械臂) 等,精度和速度又差很多。
而在轉運場景,AMR(輪式移動底盤上,可以加機器臂)是一個更好的形態,它更高效、穩定、安全,而且續航更長。
我自己去過上百家工廠,大家對人形機器人在工廠怎麼用,還沒有一個好答案。但很多客戶都需要有更好智力和視覺能力的機器人。
晚點:如果客戶本身就是投資方呢?比亞迪、上汽、寧德時代都在投資人形機器人公司。
邵天蘭:對 demo 階段肯定有很大幫助,這類支援對機器人行業也是利好。
但到真實、持續的大規模應用時,它們就不是投資方而是客戶甲方了。工業、物流等生產場景的客戶最看重的是效率、穩定性和部署成本;反而不那麼在意機器人到底用了什麼技術,或是不是很通用。
但從我們機器人公司的角度,通用性會極大影響方案成本和部署效率,這是機器人公司的核心競爭力之一。
晚點:更長期來說,人形機器人會不會因為技術發展和統一形態帶來的規模降本效應,取代很多生產場景裡現在已在執行的方案?
邵天蘭:這不是單純的技術成熟度問題,之前也提到了,狹義人形機器人在一些場景裡,比如搬重物、平地快速移動等,就不是最優形態。
真正合適人形機器人的場景應該有如下特點:任務非常靈活,工作環境為人類打造,需要機器人與真人有互動、信任甚至共情。交叉一下就是酒店、咖啡館、餐廳等服務業,以及家務、助老等。而大量其它場景,包括一些 to C、to 家庭的場景,比如掃地、擦泳池、割草等,人形的效率也不是最高的。
所以還是回到剛才說的:更重要的是通用的元件——移動能力、操作能力、感知和決策能力——這些元件能快速、靈活地組合出適合特定場景和任務的機器人,兼顧成本和效率。
晚點:資本會是一個多大的變數?現在不少公司正以更通用的願景吸引大量融資,是否存在一種可能:以資本優勢研發更前沿的技術,長期在落地上反超更早去做商業落地的公司?
邵天蘭:資本是助推器,而不是物理定律扭曲器。
歷史上,一開始就講宏大技術敘事,要直接 “登月” 的創業公司極少成功。比如上一代計算機視覺熱潮中,不少公司想做大而全的 AI 平臺,往往發展得很艱難。
更可行的創業路徑是先在產業鏈區域性環節達到足夠的效率和可靠性,形成商業閉環和資料飛輪。即使是宏大敘事的代表人物馬斯克,也有非常務實的技術和產品路線。比如 SpaceX 的長期願景是送 100 萬人去火星,但它是一步步做了低成本的重複發射和星鏈衛星網路。
晚點:一步到位做通用機器人,這不就是馬斯克帶起來的風潮嗎?
邵天蘭:馬斯克開始做 Optimus 時,特斯拉已經是市值 7000 億美元的巨頭了,也有領先的自動駕駛技術,還有自己的工廠場景,它有足夠的資源和耐心去做十年、二十年甚至三十年的規劃。
但哪怕是獨角獸級別的創業公司,資金和時間都極其有限。而且一個創業公司長時間沒有真實業務來提供反饋和檢驗,就像一個只訓練不比賽的足球隊一樣,會很容易跑偏。
太多人關注終局,更重要的是路徑
晚點:通用機器人的鏈條很長,現在各創業公司在從不同環節切入這個機會:大腦、運動控制、感測器和感知、本體硬體、手……也有自己掌握 AI 技術和場景的大公司在佈局機器人,如特斯拉、寧德時代、小鵬等。你覺得從哪個環節出發的公司未來會獲得通用機器人的最大價值?
邵天蘭:從技術邏輯推理,未來最核心的模組是 “腿”“眼睛”“手” 和 “大腦”。
但我想說,“最大價值” 這個問題本身沒那麼重要。太多人只關注終局,但更重要的是路徑和速度。
真實創業過程是:專注自己擅長的事,先找到有價值的場景形成足夠競爭力,再快速迭代、逐步擴充套件。至於最後能否拿下最有價值的環節,可遇不可求。騰訊第一個賺錢的業務是簡訊增值服務,亞馬遜從賣書起步,京東從賣電子產品起步,都不是一開始就是現在的大而全形態。
我們自己也是這樣:最擅長做機器人的感測、感知、規劃和決策,這在整個產業鏈裡價值很大,但我們不強求,也不宣稱自己做的就一定是價值最大的部分。
同時,機器人的特點是環節多、鏈條長,因為機器人非常複雜,涉及感測器、執行器、各種演算法,還有各種應用場景和對應的形態;需要 AI、機械結構、材料、能源等多種技術,最後不可能靠五家、十家公司就搞定。
所以只要一個公司能在特定環節有很強的競爭力,就有機會參與這個大生態。最怕的是什麼都做,卻什麼都不強。
晚點:梅卡曼德的路徑是什麼?
邵天蘭:第一步是從製造業和物流中的部分場景起步,建立商業閉環和資料飛輪;在這裡跑通 “Product-Market Fit”,做出有足夠可靠性、效率,能解決客戶痛點的產品。
這一點我們已經做到了:我們的智慧視覺系統已部署到了上千個場景,是全球銷量最大的公司,獲得了大量實際應用資料和行業 Know-how,在現金流、資料和產品定義與最佳化上都有正向反饋,這會帶來更快的發展速度。
第二步是透過技術進步拓展更多應用。比如大疆的無人機,它的飛控、圖傳等技術從航拍開始,可以拓展到植保、巡檢、運輸等更多場景。
類似的,我們最近也在以 DeepSeek 等模型為基礎,提升機器人的感測、感知、規劃決策等能力,當智慧程度足夠高、成本足夠低時,就可以自然拓展到更多更場景,比如醫院、藥店、便利店等服務業,最終走向所有行業和家用。
晚點:找到第一個 PMF,跑通商業閉環的過程中踩過什麼坑?
邵天蘭:一個重要的教訓或經驗是,產品完成度非常關鍵。
比如四五年前我們交付一個專案時,最長需要幾個月。因為成像效果不夠好,就要花時間除錯最佳化,也給視覺演算法帶來壓力;視覺演算法不夠好,又需要花時間除錯最佳化,並給機器人規劃帶來壓力;機器人規劃效果不好,又需要花時間除錯最佳化,給系統防錯帶來壓力。機器人智慧是一個長鏈條,每個環節差一點,整體效率就會差很多。
現在我們的交付時間縮短到了幾天甚至幾小時,而且很多時候我們自己的人完全不用參與或只遠端線上參與。就是靠一點點提升產品完成度,從同時服務 10 個客戶、100 個客戶到能服務 1000 個客戶,否則跨不過形成商業閉環和資料飛輪的門檻。
晚點:在從 0 到 1 的規模化策略上,同類公司中,也有人選擇是做更多總包和整合,這能更快達到更大的收入體量,而你們是賣標準化產品,讓整合商來交付。為什麼這麼選?
邵天蘭:首先我做不成一家好的系統整合商。作為研發出身的年輕團隊,我們的能力是死磕大系統中的區域性技術和產品。而系統整合商往往有豐富的應用經驗,擅長工藝理解、方案設計、大型專案管理、大客戶關係等等,我們是互補的。我也見過一些和我們類似的研發出身的團隊做系統整合商,普遍發展不太好。
而且我認為智慧機器人僅在製造業和物流的銷量,未來幾年內就可以到數十萬甚至百萬臺。那麼如果想做一個重要的參與者,至少也要有十萬級的出貨量,而且要覆蓋全球主流地區,這種體量只有標準化產品才能做到。這類商業模式也是現成的,比如西門子、基恩士、ABB 等,有很多參考。
晚點:當已經服務很多客戶後,你發現有哪些機器人在實際落地中才會遇見,實驗室和研發環境想不到的難點?
邵天蘭:當前學術界的很多 benchmark 是大大簡化的。比如在學界的常見標準下,機器人把一個物體抓取起來就算成功,但實際情況千奇百怪:比如便利店自動結賬這個場景,光抓取物體還不夠,還要掃碼,而不同產品的條形碼位置相差很大,有時也會被包裝上的褶皺遮擋或有汙損,這都是要實際落地才會遇到的問題。
晚點:如果作為投資人和外部觀察者,怎麼評判一個機器人公司規模化落地的進度?
邵天蘭:我的一個觀察是,當一個公司需要派最好的研發人員去服務客戶時,這是非常早期的階段;當不再需要核心研發人員,但仍需研發人員介入時,是稍微成長的階段;當專門的現場工程師就能解決大部分問題時,這是相對成熟的階段。
我們今天甚至不需要專門的技術人員,我們的客戶部署大部分是交給整合商合作伙伴和客戶自行解決的,因為產品足夠標準和成熟了。
晚點:你覺得具身智慧領域的下一個競爭點可能是什麼?
邵天蘭:找到好的產品形態和場景,並形成商業閉環。人們常常高估了技術路線的重要性,而低估了商業落地路徑帶來的限制與機會。
比如今天看,直接做全無人駕駛和 Robotaxi,發展速度不如與乘用車結合的 L2+。那些先從 L2+ 切入,服務一批客戶,有大規模收入的公司,後面也有機會往 L3、L4 發展,它們的生存和成功機率更大。
我當然可以說把所有技術都做到極致——視覺足夠通用、走得也很好、手也很好、大腦足夠聰明,就會自動解鎖所有場景。但這件事其實是倒過來的:需要先在一部分應用場景有商業價值,才能逐漸走到到更多場景。
初期場景的選擇很關鍵,太簡單難以建立競爭力;太難會導致很長時間都無法建立起商業閉環,這是一種危險而脆弱的創業模式。
晚點:整個智慧機器人行業這些年有很多波動,熱點不斷變化,這也讓其中的公司處境起伏。在變化的潮流之中,你一直相信的、不變的東西是什麼?
邵天蘭:機器人一定要產生實際價值,它不能停在實驗室裡,也不能停留在影片裡。
我們不認為自己是個追求特定技術路線的公司,我們追求 “讓機器人用起來”。這聽起來非常樸素、簡單,但也是整個行業追求了幾十年還在努力的事。
這是《晚點 LatePost》 「具身智慧對話」系列的第 9 篇。該系列將持續訪談智慧機器人和自動駕駛產業鏈頭部公司。
往期文章見合集#具身智慧對話:
題圖:梅卡曼德產品在汽車焊裝車間引導機器人完成車身件上料;來源:梅卡曼德。
晚點對話
最一手的商業訪談,最真實的企業家思考。
–  FIN  –
晚點團隊出品


相關文章