

機器的歸機器,人的歸人。
文丨王與桐 宋瑋
編輯丨王姍姍
餘軼南笑起來像韓國硬漢演員馬東錫,也像馬東錫一樣有些江湖氣,他穿著老幹部夾克,儘管研發了 9 年智駕,他開的車卻並不是特斯拉或者新勢力,而是邁騰。
江湖氣的管理哲學和科研出身的技術底色在餘軼南身上共生。他 2012 年博士畢業於中科院自動化所,先是進入百度深度學習研究院當科學家;2015 年,他在博士期間結識、後來成為他在百度主管的餘凱說了句 “我們一起去做 AI 晶片吧?”,餘軼南就加入了餘凱創辦的地平線。
在地平線的 9 年裡,他從一線技術人員幹到了智駕負責人。地平線是一家以晶片、演算法和解決方案實現智慧駕駛的公司,餘軼南負責的智駕業務是地平線現在的核心業務,有一千多人。他要管研發、產品運營、商務管理,在越管越多的工作裡不斷點多、點雜自己的技能樹,比如財務、法務、供應鏈、談判。
但餘軼南越做 to B 生意越明白,在產業鏈中只有佔據 “鏈主” 的角色,才能掌握更多的利潤和話語權,所以他想做面向 C 端向能完整交付的產品,成為機器人的 “主機廠”。
在 100 天前,他找到有工程落地能力的宋巍,和有產品、使用者洞察的趙哲倫一起創立了機器人公司——維他動力(Vita Dynamics)。

從左向右分別是:宋巍、餘軼南、趙哲倫
餘軼南勸當時地平線同事宋巍一起創業時,也說了一句話:“走吧,我們一起去做機器人。” 此前就職於理想汽車的趙哲倫, 在 2023 年智駕端到端的技術架構出現後就與餘軼南一起聊機器人產品構想。
創業僅三個月,維他動力已連續獲得兩輪融資——今年 1 月,獲得由地平線和高瓴創投領投,元璟資本、柏睿資本、百度風投和初心資本跟投的近億元種子輪融資;最近,他們完成由今日資本和凱輝基金領投、雅瑞資本參投的種子 + 輪融資,累計金額達 2 億元。
具身智慧現階段還沒有形成太多共識,用餘軼南的話來描述,正處於 “春秋時代”——百家爭鳴,誰也爭不出對錯。討論最熱鬧的是人形機器人進工廠,擰螺絲、分揀電池、搬東西。
餘軼南則站在這些討論聲音的對岸。他認為機器人的最大場景並不是工廠——因為機械臂已經夠用了——而是個人和家庭,中國有四億個家庭。其次是服務業,“很多服務場景是需要 24 小時、高質量、一致性的服務”。
更重要的是,他提出人形機器人不應該是機器人的唯一形態,不同場景下的機器人都會有自己形態的最優解。
在與我們交流時,餘軼南反覆提到兩條技術成熟度曲線——難度從簡單到複雜,容錯率從高到低。所有的場景都可以在這兩條線形成的座標軸上找到自己的位置。AI 在很多領域都已能駕馭複雜需求,但機器人產品的技術成熟度目前還只能做容錯率較高的事。
“很多人一想到機器人要把高腳杯放進頭頂的碗櫥就覺得太難了,實現不了,但我們可以先從簡單的任務做起。” 餘軼南的想法是,技術是技術,產品是產品。原理性技術還在不斷摸高的同時,一些已經成熟的技術則已進入 “產品入場” 階段——先創造價值,沿途下蛋。
維他動力已確定的首款產品是基於戶外場景的四足機器人,預計今年年底釋出。更為具體的產品使用畫面是:一家人去郊外遊玩,機器人會從一輛理想 L9 裡跳下來,跟隨主人,幫忙揹負重物,也能負責記錄一家人遊玩的精彩瞬間。
第二款規劃中的產品將會進入室內場景,用於完成收納、整理等任務,產品構造是 “機械臂 + 輪式底盤” 的組合,或許還會配以一種布藝外觀——目的是以一種更為舒適的形態進入家庭。這款產品的上市日程表定在 “三年之內”。
餘軼南希望他們的機器人不要扮演 “入口” 的角色,不做資訊、娛樂、廣告的平臺,儘管那些方向的商業模式看起來更加簡單直接;家庭機器人,不需要 “說人話” 和配備顯示屏。
最高效的互動,只需要簡單的聲音、光影和肢體。這背後是餘軼南對產品第一性原理的思考:物理世界的歸物理世界,數字世界的歸數字世界。
趙哲倫給我們分享了一個名叫《齊馬藍》( Zima Blue )的故事,是系列動畫片《愛,死亡,機器人》( Love, Death & Robots )中的一集。藝術家齊馬是全宇宙最會畫畫的機器人,他的畫中間總是有一個藍色的色塊,這個色塊就是 “齊馬藍”。當記者在他生命的終點詢問 “齊馬藍” 意義時,齊馬給出的答案是:他最開始是一個泳池機清潔機器人,後面他的功能被不斷累加,變成了如今的樣子,而那個色塊是他記憶中泳池的顏色。
故事的結局是,齊馬在藝術巔峰時刻拆除了各種功能元件,變回泳池機器人,在泳池裡執行著最原始的清潔指令。機器人的形態和功能會隨著時間的演進不斷變化疊加,現在的人類,正在塑造齊馬 1.0 版本。
“端到端出現後我第一反應是:可以搞機器人了!”
晚點:你是什麼時候下定決心做機器人創業的?
餘軼南:十幾年前我就想做機器人,一直找不到天時地利人和的機會。
晚點:想了十幾年,為什麼是現在?
餘軼南:特斯拉端到端的技術架構出來後我的第一反應就是:可以搞機器人了!那會是 2023 年,我約還在理想的哲倫喝酒,他以為我要聊智駕的端到端,結果我大聊機器人。
汽車是四個輪子,運動軌跡相對簡單,只有前後和左右,且只在二維平面裡。但四足機器人的運動軌跡會有 12 種自由度,比汽車複雜 3 倍,就需要在更高維的空間裡做最佳化。
智慧駕駛早期是用結構化白名單的模式,即在交通環境里人工定義很多目標,感知系統針對每個目標去檢測、識別,再做環境理解,然後規劃。2023 年智駕走向端到端模型後,實現了從感測器輸入(sensor in)到控制輸出(control out)的自動化決策。2024 年底,智駕又進一步演進為 VLM+VLA(視覺語言模式 + 視覺語言行動模式)的協同框架。
如果還是過去那種靠人工編寫規則的傳統架構,很難控制複雜的機器,但隨著架構演進,機器能自己學習、不用人來寫規則,那就有可能實現幾十個電機在高維空間的理解、規劃、執行。
晚點:李斌剛造車時說造車需要 200 億元,後來發現遠不止這個數。雷軍造車時說要 300 億元。要造出你想要的機器人,需要多少錢?
餘軼南:起步階段,要在五年內實現百萬臺的量產,投入可能在百億元級別才能上牌桌,但是這 100 億元肯定不是單靠融資能得到的,要有先落地的產品,自造血。
晚點:智慧駕駛也是機器人的前序,這跟你現在做的 AI+ 機器人有什麼本質不同?
餘軼南:我們想做一個 AI 原生產品,而不是 something plus(把 AI 能力附著在產品中)。這兩者的核心區別是,AI 本質上是有趣的靈魂,把這樣的靈魂放在什麼軀殼是很關鍵的。
智駕是把 AI 技術嫁接在一個現有的產品形態——汽車上,而汽車形態在過去一百多年裡已經固化了,這個物理軀殼太受限,而 AI 本身的能力更大,所以我決定不能再繼續做汽車,而是要完全創造一個新的本體,把 AI 的價值更充分地發揮出來。
晚點:你過去做智慧駕駛的經驗怎麼轉移到機器人產品中?
餘軼南:汽車和機器人的底層是一樣的,都是本體和入口。再往上需要環境感知、環境理解、任務理解、任務拆解、推理、規劃、執行、最終是控制,整個鏈條都非常長。
智慧駕駛從分段式走向端到端,再走向 VLA+VLM 的架構,機器人也是差不多的進化路徑。
兩邊技術架構很像,無非是感測器輸入的部分不一樣,汽車是十幾個攝像頭和雷射雷達,機器人攝像頭會少一些,也有雷射雷達,還有觸覺感測器等;複雜度也有區別,汽車只有兩個維度的自由度,但機器人少說 10 來個、多則 60 多個自由度。
但二者整體快慢系統架構的差別是很小的,基本架構在邏輯上是一樣的。機器人的運動控制,系統更新頻率(指控制器每秒向執行器傳送指令的週期)能做到 50 赫茲,也就是 20 毫秒一個週期。汽車在雙算力晶片的架構中,一顆晶片上跑慢系統可能跑到 2 到 4 赫茲,另外一顆跑快系統,可能跑 20 到 30 赫茲。
晚點:如果相似度很高,你也會用自動化程度劃分機器人的階段嗎?
餘軼南:L1 階段是基於遙控的機器人;L2 階段是在人的監管下機器人能自主活動;L3 階段是即使沒有人的監管也能自主活動。L3 實現與否主要是責任兜底問題,這和智駕的 L3 概念類似。
大多數人現在對智駕 L3 的定義是接管率,但接管率只是數字。我的定義是從駕駛員的責任轉變為保險公司的責任,只要出了事故還是駕駛員負責,那就不是 L3。機器人的 L3 也是類似,如果出了問題還是使用者承擔,那就不算。
晚點:現在很多機器人已經能做高難度的動作了,在你定義裡他們屬於什麼階段?
餘軼南:很多漂亮的、高難度的動作是靠遙控完成的,本質還是 L1。我們希望做的機器人是 L2 階段。
晚點:你說的機器人完全自主的 AGI ,會比智慧駕駛的 L4 更慢實現嗎?
餘軼南:我們要把場景都拆開,每個場景有自己的時間軸,比如物流機器人、分揀機器人,L3 已經實現了。
“我造的機器人,是要讓人遠離數字世界的困擾。”
晚點:你們辦公室門口擺了個破舊的瓦力,為什麼不是放鋼鐵俠或者人形機器人?
餘軼南:之前地平線公司門口也有一個瓦力,比我們現在這個更大,一米八高,我們為那個瓦力做了環境感知語音互動,它會在我們進門時就打招呼。開始創業後,我看到門口有點空,就想搞個大的瓦力,不過找不到那麼大的了。
我覺得 “有趣、有用、有生命力的靈魂” 才是機器人的核心,瓦力就很有生命力。英偉達 GTC 大會壓軸的雙足機器人,走起路來頭一晃一晃,也讓人感覺很有生命力,即使背後就是一套演算法和軌跡生成的。
晚點:大家現在都爭相讓機器人進汽車工廠幹活,為什麼你們不這麼幹?
餘軼南:現在工廠的大部分過程都實現了自動化,即使是日產 1000 臺汽車的高效產線,工人數量也並不多,且人的勞動都是輕量級的。所以,用機器人替代工廠裡為數不多的工人,去幹工人完全勝任的活兒,在商業層面是偽命題。不過這件事在歐美是成立的,歐美勞動力短缺且昂貴。
技術發展到某些階段需要場景來做驗證,擰螺絲、搬東西——這些場景是起到對技術的驗證作用。
晚點:特斯拉作為公認的領導者,提出讓人形機器人進工廠,所以多數人認為特斯拉的選擇就應該是正確的。
餘軼南:首先並不能夠去證偽說特斯拉是錯的。但大家都認為是正確並不一定真的正確。馬斯克如今已經是世界級的企業家,如果他要說做機械臂,即使這條路線是對的但聽起來不性感,股價可能就一下跌下去 30%。這屬於巨頭的魔咒——只要出一個低於預期的產品,其他方面會受很大損失。
在我的願景裡,人形機器人絕對不會是唯一的機器人形態,未來各種各樣奇奇怪怪好玩的機器人會在大馬路上、在你家裡、在你的辦公室來來回回地走。
晚點:有人認為做人形機器人最合適,因為這個世界上物體尺寸、空間尺寸、東西的位置等設定都是按照人的活動範圍和習慣來定的。
餘軼南:為什麼它一定最合適呢?這種想法不夠嚴謹。很多人這麼想是因為人形意味著通用性——可以像人一樣在灶臺上做飯、可以去鋪床單,但這件事本質是機器人能操作的高度是多少、移動能力是怎樣的,每個場景都有可能找到與之對應的最優解。
我們看過太多的科幻電影,裡面有多少是人形機器人?今天能被記住的其實都不是人形的,比如《星球大戰》裡的 R2-D2 和球形機器人。《超級陸戰隊》裡的大白屬於人形,但它又不屬於今天意義的人形。瓦力甚至沒有語言,只有一些咿咿呀呀的聲音。
晚點:什麼情況下你會做人形機器人?
餘軼南:當人形機器人被用來追求更高、更快、更強的極致技術時,我會考慮。讓人形機器人進行挑戰技術高度的比賽,類似汽車行業裡的世界一級方程式錦標賽、人類生活裡的奧運會,用來挑戰人所不能夠達到的生理的極限,比如它能跑得比博爾特更快。
但是我對把人形機器人搞成一個產品現在還沒太大興趣。
晚點:在你的構想裡,進家場景裡,收拾東西、做飯的機器人應該是什麼形態?
餘軼南:一種既能完成功能又讓你感到最舒適的形態。什麼樣的形態會讓人舒適?首先是一個我們經常看到、感到習慣的形態,比如布藝外殼而不是金屬外殼,形狀可能像圓桶一樣,佔地面積不要超過掃地機。這樣形態的機器人,帶著機械臂,也有通用的移動能力,一定比人形機器人好。
我不會給家裡買個人形機器人。首先它放哪兒都是個問題,要專門給它做一張床嗎?還是說,讓它一直站在你家牆邊上?我希望機器人用完能被收納,並不佔空間。我做產品的原則之一是,如非必要不增實體。
不管是不是人形,機器人都應該具備三種能力:自然互動、自主移動、自主操作。室內場景對自主移動的需求度不高,輪式底盤又穩定又低成本,佔地面積也小,但這種場景對自主操作能力的要求高;戶外則相反,對自主移動需求高,但不需要有太高的操作能力。
至於機器人的自然互動,需要有輸入、輸出的硬體,比如揚聲器、感測器,但並不一定非要是有頭的形狀。

維他動力的室內機器人設計手稿
晚點:你希望你的機器人是一個有用有趣的生活夥伴,而不是入口?
餘軼南:人不應該離電子裝置太近。
過去兩千年人類從來沒有像此刻這樣被資訊灌輸,而未來還將出現兩種情況:一種是人就只應該進行低成本娛樂,就像《頭號玩家》裡那樣,人只是給演算法世界提供資料;另一種是解放了雙手的人可以去探索、創造。我們永遠期待後者,但社會趨勢會往前者走,並且不像《頭號玩家》演繹得那麼酷,大部分人會被數字洪流帶走了,這是很悲哀的事。
如果我們造出的機器人只是給人提供服務,讓一部分人遠離數字世界的困擾,這是一件好事。
晚點:所以長遠來說你真正想解決的問題是什麼?
餘軼南:讓機器的歸機器,讓人的歸人。這也是餘凱說過的。或者說,讓物理世界的歸物理世界,數字世界的歸數字世界——讓所有的生產作業由機器人去做,同時人不要被別人的演算法帶進去,而要追求自己想要的東西。
“機器人能不說話,就不要說話。”
晚點:你覺得機器人最好的落地場景是什麼?
餘軼南:按照市場大小,最大的場景一定是家庭。中國大概有 4 億家庭,規模非常大。能實現家庭的清潔、收納、資訊整合的家用機器人——知道家裡東西在什麼地方,並且能為提供服務——這樣的機器人一定是世界上規模最大的機器人。再是服務場景,比如各種酒店的前臺、咖啡館的吧檯、便利店,都需要機器人,出發點不是成本或者效率,而是能讓人獲得 24 小時、高質量、一致性的服務。最後是工業場景。
晚點:為什麼是收納和整理,而不是倒茶或做飯?
餘軼南:我們考慮兩個維度:功能的技術複雜度從低到高,容錯率從高到低。拿起一個水瓶再放下是簡單操作,現在已經有 95 % 以上的成功率;拿起一個瓶子把瓶蓋開啟,把水倒入一個杯子裡,這個操作是複雜的。沒拿住礦泉水瓶,摔到地上,任務失敗了但失敗成本相對是低的;如果換成玻璃杯、盤子摔到了地上,失敗成本就高了。
家庭所有需求都能在由這兩個維度構成的座標系裡被平鋪開,最早可實現的就是收納和整理,任務簡單且容錯率高,比如讓機器人從沙發上拿起孩子的玩具收納到櫃子裡,這種服務 3 年內就能實現。針對容錯率低、更復雜的場景,可能需要等 10 年甚至 15 年。
AI 做複雜的事情是容易的,只要人採集了很多資料教它就能做出來。但 AI 完成低容錯率的任務就很難。10 年之前就有很多公司花 3 個月做出了 L4 機器人的 demo 了,但現在還沒有落地。
晚點:但你們要推的第一個產品為什麼是室外機器人?
餘軼南:目前 outdoor 的技術會比 indoor 更成熟。過去 3 年,outdoor 的技術比如運動控制等發展很猛;從去年到 2027 年,indoor 的技術會發展。當學術界在努力工作時,我們應該冷靜等一等,基本原理性技術更加成熟,才是產品的入場時間。
晚點:這款室外產品的使用者會是誰,要解決他們什麼需求?
餘軼南:我們把第一款產品定義為有用和有趣。我們聚焦生活狀態比較收斂的家庭使用者,他們的生活有兩個空間:家和車。比如理想車主就是我們圈定的典型使用者。
當車停到了景區的停車場,機器人能夠自己從後備箱裡跳下來,到遛彎、徒步的環境裡,負重、陪伴,以及記錄精彩瞬間。
晚點:你們還參考了理想汽車的後備箱空間來設計機器人尺寸嗎?
餘軼南:我們產品尺寸設計,首先是能透過家庭室內的窄道——大概 40 釐米寬;第二個是公園入口等位置的回形欄杆,機器人得自己走過去;第三是從車的後備箱裡跳下來以及跳回去的能力——我們按照理想 L9 的後備箱 78 釐米高,設定機器人要跳回 80 釐米高的地方。跳下車和後空翻等單個動作都很簡單,但跳回去仍然很難。我們現在還在研發怎麼讓它跳回後備箱,這裡面會涉及最佳化峰值扭矩和產品重量之間的平衡。
晚點:你們似乎也還比較在乎產品的顏值,這一點很容易被技術型創業者忽視。
餘軼南:顏值非常重要,但不是那種酷炫的,而是溫和。要讓使用者感覺我們的戶外機器人正義、忠誠、勇敢,室內機器人則是溫暖、安全的。

維他動力的室外機器人手稿
我還想做一個軟皮膚,但實現起來有難度。我跟從機器人行業招來的人討論問題,他們會說機器人行業以前從來都不會討論這些,討論更多的是功能性,比如需要五指還是抓夾,而我就會關心能不能有軟的皮膚,結構是外骨骼還是內骨骼。
今天的機器人某種意義上都是外骨骼,也就是外支撐架構,就像烏龜、螃蟹一樣支撐是在外殼上面。但哺乳動物都是內骨骼的架構,皮膚是軟性的。所以,做架構設計時就應該先把內部實現好,外在部分則是靈活的、可定製化的。
機器人的核心是 AI + 電子電氣架構,本體結構是多樣的,外觀也是多樣的。
晚點:你希望你的機器人有問答互動功能嗎?比如要接 DeepSeek 嗎 ?
餘軼南:我希望機器人能不說話就不要說話。一個機器人,張嘴說人話就破壞了美感。但不說話不代表沒有思考邏輯,不代表沒有互動。
決定出來創業之後,我重新看了《機器人總動員》,發現整部電影居然是啞劇風格,瓦力和伊娃更多是透過肢體和聲音交流。我認為機器人最好的表達方式是用簡單的聲音和光影,最好的語言是肢體語言。
我們要考慮使用者的第一互動優先順序。在做智駕時,我們做了很多互動嘗試,當時最魔幻的設計是當攝像頭檢測到車內有人抽菸,車窗就會自動開啟,但在後面測試環節總有失誤——每當人手一放在嘴邊,車就要自動開窗。事實上,開窗本身只需要 “按一下”,這才是開車場景中最天然、優先順序最高的互動形式。

具身智慧原理性技術與工程化技術的發展週期
" 我需要全棧閉環、全攻全守的特種兵部隊。"
晚點:今天你們定位的市場以及產品形態,真的是別的創業公司沒看到、只有你看到了?會不會是這個場景根本不存在?
餘軼南:去年七月到十月,我跑了 15 家以上機器人公司,沒有做 to C 方向的。大家還是覺得做家庭場景很難,但本質他們還是從技術角度出發,而並非從產品或者從使用者角度考慮問題:一想到要把高腳杯放進頭頂的櫃櫥就覺得實現不了。但其實把場景拆解之後,就知道有什麼可以開始做了。
晚點:機器人的產業鏈很長,鏈條上的其他能力如何靠團隊補足?你的兩位聯創是怎麼選定的?
餘軼南:我們定位自己是機器人的主機廠,所以首先就要有 “車” 而且是輛 “好車”。我們需要從軟體到硬體的系統的工程能力,從演算法到本體全都能吃下來,把車先造好。宋巍擅長系統工程,哲倫有非常強的使用者洞察,懂產品定義和市場營銷。
當然,擁有非常強的 AI 團隊也是核心能力。現在我自己帶 AI 團隊,我也最擅長 AI 演算法,同時也還在為這個團隊找 VP。
晚點:這次創業你有告訴自己一定不要再犯哪些錯誤嗎?
餘軼南:一定要保持組織的簡潔。今天的組織效率跟過去非常不一樣,AI 工具可以在專業領域提高十倍效率,也能讓人學習速度大大加快,比如不懂網頁前端的人也可以 10 分鐘製作出一個公司網頁。
這帶來的是,一方面縱向上人的效率會提升,橫向上學習的範圍會擴寬。所以組織里個人能力素質的要求會變強,專業和經驗要求會變弱。這種新的組織形態是小而精的,每個人的成本會提高但是總成本會下降,並且能降低溝通損耗。所以最開始投資人問我第一階段需要多少人,我說 300 人,但現在我覺得也就需要 50 到 70 人。
我們面對的是不確定的市場、不確定的需求和不確定的分工,所以組織形態要能應對這種不確定性帶來的風險,在對目標達成共識的情況下,模糊掉所謂的邊界和分工。我希望我們的工程師可以既懂下游又懂上游。我需要一個全棧閉環、全攻全守的特種兵部隊,能夠相互補位。
晚點:你怎麼說服優秀的人才加入?現在在技術攀登期,加入創業公司是有波動性的。
餘軼南:十年前的我,餘凱說一句話我就跟著走了:“我們一塊兒出去幹一個 AI 晶片吧?” 我的回答自然而然就是:“好的,咱們一塊走。” 所以說服優秀的人,首先要有戰略共識和共鳴。
現在大家還是對產業未來發展有疑問,以及現在這個階段是不是適合從大公司或者從研究機構跳出來去做產業界的東西,這也是個疑問。
晚點:你透過什麼方式判斷人是不是有潛力、是你要找的全攻全守型人才?
餘軼南:一個人的潛力其實很大的程度上體現在他做過他過去並不擅長做的事情,但是能夠快速鑽進去並把這件事情幹好。所以我面試時一般會問 “有哪些事情是你不擅長但結果做特別好的?”
晚點:那麼,有什麼事情是你曾經以為自己不擅長但事後看是做特別好的?
餘軼南:我曾經以為我不擅長做 to B 業務,剛開始管理地平線智駕產品時,我第一件事不是跑去做產品的定義和做技術的分析,而是花 3 個月跟我們銷售把當時全國五大片區跑一遍,每個片區跑兩週。
在不斷給客戶介紹產品和技術過程中,一次次跟客戶把酒言歡、相見恨晚過程中,我對技術、業務的思考就不一樣了。
晚點:你身上有一種技術人員罕見的江湖大哥氣質,這是那幾年與客戶把酒言歡歷練出來的嗎?
餘軼南:我在百度工作時還是純粹的科學家,後來在地平線創業的 9 年,從技術人員變成產品線負責人,再延伸到產品運營、商務管理等等,這一路我點的 “技能樹” 又多又雜,財務、法務、供應鏈、談判、喝酒,全鏈條。這次創業,我又學到了新的技能——融資。
晚點:機器人公司的估值正在水漲船高,宇樹超 70 億元,銀河通用超 30 億元,還有很多估值在 10 億元以上的公司。這麼看,你們現在融了 2 億元並不多。
餘軼南:就這個產業未來 50 年真正能產生的價值而言,你列舉的這些公司估值都還太低了。機器人產業會比汽車工業規模更大,它對社會底層基礎設施會帶來巨大變化,影響更為深遠。今天在大街上還沒有機器人走來走去,但我相信我們的下一代會習慣機器人在大馬路上走來走去。
如果這樣判斷,按目前全世界汽車市場每年的銷量大概是 9000 萬臺來看,未來機器人全球出貨量會更大。
晚點:面對越來越多具身智慧參與者——車企、科研團隊、傳統機器人公司,你比較害怕哪一種對手?
餘軼南:現在的幾類對手:創業公司、中號企業、超級巨頭,跟他們的競爭是有時間順序的。
第一類是創業公司,大家還沒搞清方向,處在 “春秋時代”——百花齊放、百家爭鳴,你說你的、我說我的,都有自己的邏輯閉環,誰也證明不了誰對誰錯。等後面 “戰國時代”,所有人戰場上見。現在智駕已經處在戰國時代,機器人產業還在春秋時代。
還有一波已經在細分市場上取得巨大成功的中號企業,比如掃地機器人、無人機、電動平衡車這樣的品類。如果他們轉型做智慧機器人,可能三年之內會成為我們在戰場上直接見面的對手。
晚點:中號的企業如果這一兩年內就要進場了,你們怎麼防守?
餘軼南:我們就輕裝上陣。他們一方面要把現有技術做好,還要分一部分資源幹新的市場,難度也很大。
第三波是巨頭,比如位元組、華為、小米、比亞迪、理想這樣的公司,他們在自身戰場上的仗還沒打完,所以會在更晚一些入場。現在機器人市場也還不夠大,未來技術成熟、趨勢明確,巨頭進來就是要搶蛋糕的。
汽車市場大概是 2.5 萬億元規模,而機器人至少要達到 5%~10% 的汽車市場規模,也就是 1250 億元至 2500 億元時,巨頭才會入場。
晚點:你剛才說三波梯隊,很像汽車領域的競爭。
餘軼南:我覺得機器人產業的競爭節奏會在汽車和掃地機這兩種產品之間——掃地機 6 個月一個迭代,汽車大概 15 個月一個迭代。
晚點:競爭烈度呢,也在這二者之間?
餘軼南:還沒到那個階段,大家目前都還處在形成共識的階段。
晚點:你會擔心出現像 DeepSeek 這樣的黑馬嗎?本來大家都還在搞 DAU,突然業內殺出來一個模型能力、技術能力很強的對手,能做出與需求契合度更高的產品?
餘軼南:軟硬體結合的賽道不會,純軟體賽道很有可能出現。
晚點:這個行業是不是也需要巨頭入場,共同培育?
餘軼南:肯定是的。華為進入汽車市場,早期的產品可能不行,但它帶來了潑天的流量,讓小米接住了。使用者都跑去看汽車了,手機這種商品就沒人關注了。這個就是巨頭入場的核心價值。
晚點:所以最可怕的競爭是前面巨頭入場帶來潑天流量,被另外一家接住了。
餘軼南:我們希望汽車是雷總最後一次創業。到時小米真做了機器人,他可能會說,機器人也是一種車。
題圖來源:《機器人總動員》
– FIN –





