
當科技的浪潮拍打時代的堤岸,我們站在怎樣的座標上眺望未來?
機器人產業的發展階段,恰似春江水暖時節的微妙變遷;而突破智慧湧現的瓶頸,則是人類與機器共同譜寫的壯麗詩篇。此次混沌的演講,明星機器人產品團隊維他動力創始人兼CEO、混沌學園6期同學餘軼南博士以深邃的洞察為“如何攀登科技珠峰,探索通用機器人的產品化之路”勾勒出清晰的輪廓。

餘軼南博士,2012年任百度深度學習研究院高階科學家,2015年創業地平線,曾任地平線智慧駕駛總裁,2024年12月創立維他動力。
為什麼說當前是機器人產業發展的黃金視窗期?技術正規化變革將如何重塑產品邏輯?在百家爭鳴的"春秋時代",企業應該選擇怎樣的技術路線?這些困擾行業的核心問題,在餘軼南博士的演講中都得到了深入解答。
"Concept is cheap(概念不值錢),我們需要的是the product(真正的產品)"。餘軼南博士的演講直擊行業本質,從技術演進規律出發,透過闡述AI 2.0時代大終端產品必須具備的兩大特徵——“萬元級產品單價、千萬臺年出貨量規模”,拉開了這場思想碰撞的關鍵一角。



如何定義具有革命性的“大終端”?
縱觀過去10至20年的發展歷程(前AI 1.0時代、AI 1.0時代),在軟體、人工智慧和演算法技術領域,可以觀察到一個顯著的演進模式:這些技術往往會經歷兩個階段。第一階段,它們首先在網際網路領域引發革命性變革,重塑整個數字生態和應用正規化;隨後進入第二階段,這些技術會突破虛擬世界的邊界,向物理世界延伸,從而催生更廣泛的社會變革。值得注意的是,在第二階段,通常都伴隨著新一代終端裝置的誕生。

這一演進軌跡在科技發展史上清晰可辨:從大型計算機到個人電腦,從功能手機到智慧手機,再到如今蓬勃發展的智慧電動汽車。那麼,在AI2.0時代來臨之際,下一個具有劃時代意義的終端裝置將是什麼?我們又該如何定義一個真正具有革命性的"大終端"?
我認為需要滿足兩個關鍵條件:第一,產品單價應在萬元以上,而非幾十或幾百元的低價值品類;第二,年出貨量需達到數千萬至上億規模,這種量級才能真正推動產業成熟。

通用機器人的歷史機會:天時、地利、人和
產業的成熟需要幾個必須條件。
首先我認為算力、電力和智力等核心能力成熟,奠定了今天機器人行業爆發的最核心基礎。
回顧過去十年,我們可以看到。第一,電池的能量密度,用10年的時間提高了一倍左右,而且這個速度還在加快;第二,算力方面,目前仍然遵循摩爾定律,而且比過去的CPU時代更快一點,大概每18個月翻一倍;第三,AI模型本身的進步也至關重要。全球數百萬演算法工程師持續最佳化模型架構,這形成了一個規律:最優模型的效能密度大約每100天提升一倍。這意味著,100天后僅需當前一半的算力即可實現同等模型的效能。
同時,技術的正規化也在不斷演進;從早期的模組化設計,到端到端架構,再到如今的多模態大模型範式;
除了模型範式,訓練方法同樣經歷了顯著躍遷——從需要很多人工標註的監督學習,到大模型環境下的無監督預訓練,直至當下,基於模仿學習、強化學習和世界模型的訓練架構。這些突破性進展,都密集發生在短短十年間。
與此同時,需求側也在變化。以我國市場為例:人口老齡化程序加速,勞動力人口占比持續走低,家庭服務消費比重逐年攀升。資料顯示,65歲以上老年群體對居家服務的需求正呈指數級增長。另一方面,55%的年輕消費群體更傾向於"付費省時"。對這些年輕消費者來說,過去親力親為的事務,如今更願透過購買服務解決。
結合這些趨勢,我們正面臨通用機器人的歷史性機會,而這個機會可以總結為天時、地利、人和。

“天時”是指行業成熟度的提升,包括電池能量密度、算力、模型最佳化等技術的進步。“地利”是中國擁有龐大的AI人才、網際網路人才、製造業基礎和完整供應鏈。"人和"優勢則表現為雙重驅動:一方面是中國龐大的人才紅利,另一方面是快速擴張的市場需求。
當這些關鍵要素形成共振,就創造了機器人產業發展的黃金視窗期。

機器人產業正處於“春秋時代”
我們必須清醒認識到當前機器人產業所處的發展階段,才能制定正確的戰略,並明晰制定什麼樣的策略才能推進業務的發展。我的判斷是:機器人產業正處在"春秋時代",而且是春秋早期。

什麼是春秋時代?春秋時代是一個百家爭鳴、百花齊放的時期。它跟今天有點相似:各種技術路線和商業觀點都在激烈碰撞,沒有絕對的對錯之分,每個參與者都在積極輸出自己的認知框架。可能再過幾年回頭看,今天的很多觀點既可能被證實,也可能被證偽。
5到10年後,這個階段可能過渡到"戰國時代"。屆時沒有人再進行觀點的爭論,行業格局會逐漸明朗,所有戰爭都以一方勝利、一方失敗告終。
今天的電動汽車/智慧汽車行業已經明確進入了戰國時代,但機器人行業還處在春秋時代。
在技術發展的宏大週期中,"春秋時代"意味著創新技術和應用的爆發期。由於行業裡每個人的想法和方向各不相同,各家企業都在不同領域試錯,這種局面往往會催生大量創新。

以手機行業1990-2010年的演進為例:智慧手機的完整概念早在1992年就已形成,但受限於當時的技術條件無法實現。在這關鍵的20年間,市場湧現出各類終端產品:手機、PDA、Game Boy遊戲機等,它們各自在細分賽道持續演進。直到2007年iPhone橫空出世,才完美整合了這20年的技術積累和市場探索。

產品才是推動產業發展的關鍵錨點

Concept is cheap(概念不值錢),我們需要的是the product(真正的產品)。VITA的產品觀是"拒絕完美主義",正如所說喬布斯,"Real Artists Ship"(真正的藝術家就要交付作品)。無論想法多麼宏大、願景多麼美好,關鍵是要腳踏實地拿出產品,即使不完美,即使離理想還有差距,也要先推向市場,讓使用者告訴我們什麼是對的。
因此我們需要打造一個以產品作為核心錨點的閉環鏈條。鏈條裡包括:用好的產品去推動好的商業發展;有了好的商業、好的財務基礎以後,才能夠去吸引更好的人才;有了更好的人才,才能去不斷地構建更深的技術的護城河,然後進一步推動整個產品的發展。
歸根結底,產品才是推動產業發展的關鍵錨點。

VITA的技術觀
在喧囂的市場環境中,我們每天都能聽到各種概念,但真正有競爭力的產品,絕不是靠一個BUZZWORD(熱門技術詞彙)或某個技術單點突破就能定義的。

優秀的產品從來不是一蹴而就的,而是由一系列工程化積累、苦活、髒活、累活堆疊而成。構建真正的技術壁壘,必須同時跨越兩道門檻:第一,大規模的工程化積累;第二,面向使用者需求和場景時對每一個細節的深度打磨。
每個時代都有其技術主題,而認清當前技術發展的真實階段至關重要。如果連這個基本判斷都做不到,就很容易陷入盲目投入的困境。
我們認為,技術的演進通常可以劃分為兩個主要階段:
第一個階段是原理性技術的爆發期。這個階段主要由實驗室和科研機構主導,他們探索出新的技術方案和技術原理,為整個行業指明技術產品化的可能性。
第二個階段是產業化落地期。在基礎原理突破之後,產業界透過工程實現、產品設計和市場營銷等手段,將這些技術轉化為成熟的產品。

十年前,當AI 1.0到來的時候,智慧家居、人臉支付、人臉識別、語音識別等技術,其實已經開始了產品化;而城市智駕、高速輔助駕駛等,還處於尚在研究的階段。
如今,這些技術曲線都實現了明顯右移。例如ADAS系統在新車型中的滲透率已達60-70%,許多AI 1.0時代的實驗室技術,已被大規模地應用在實際的產品上。
反觀機器人的技術,包括四足(機器人)、夾爪、雙足(機器人)、靈巧手等,目前都還處於比較早期的階段。距離工程化技術、產業發展,還存在著巨大的差距。而這個差距,也就是如何從原理性技術過渡到工程化技術,恰恰是產業發展最大的機會點。

如何讓機器人實現“智慧湧現”?
所以下一個關鍵問題是:如何抓住這個機會點?很重要的一點是資料。
我們可以參考大語言模型(large language model)的發展路徑。大模型之所以能取得突破,是因為它吸收了全網際網路的資料,並且不分語言種類,只要是能表達成文字序列的內容都作為自身的資料,包括圖片、影片、音訊等。這種海量、多樣的資料,他們聚集為一體的時候,就產生了"智慧湧現"的現象。
由此我們可以思考:什麼樣的場景能產生足夠豐富的資料,讓機器人也實現智慧湧現?

我們的看法是,必須讓機器人在物理世界中探索,才能獲得足夠多樣且持續的場景資料。這其中最重要的兩個場景就是戶外和家庭環境。

戶外的核心能力在於機器人的移動能力,室內的核心能力在於機器人的操作能力。
與此同時,人機互動介面也發生了根本性變革:從傳統的鍵盤、滑鼠、觸屏,進化到人與機器人直接對話的互動方式(NUI:Natural User Interface)。
這些正是當前機器人技術與過去產品最本質的區別。

因此,尋找通向通用機器人的第一塊拼圖,我們的方法是從垂直場景切入,然後用平臺化技術持續迭代,最後讓產品從專用逐步走向通用。
在技術選擇上,我們傾向於選擇原理性更成熟的技術。在資料方面,我們希望場景和資料更加發散。在使用者場景上,我們選擇具有高付費能力和意願的場景,來支撐商業化變現。透過技術、資料、使用者場景的閉環迭代,最終實現通用機器人。

通用人工智慧是珠峰,讓我們頂峰相見

通用機器人很可能是人類科技史上的"珠峰"。對於所有場景,可以從兩個維度來評估:1、任務從簡單到複雜;2、場景的失效成本從低到高。
透過這兩個維度,我們可以把所有技術和產品放在一個二維平面上進行分析。比如用大模型寫檔案時,即使寫得不好,影響也不大,因為有人工稽核兜底(如Chatbot、程式設計、學術研究)。這類場景雖然任務複雜度高,但對失誤容忍度高。再比如自動駕駛,任何小失誤都可能造成人身傷害甚至生命的損失,失效成本極高。
我們最終極的目標是希望機器人可以變成一個通用的機器人。所以我們需要找到一條路徑——從今天已有的產品、已有的使用者需求、已有的市場上,不斷地去逼近。這時會有兩條路線:一條路線從左邊走過去,一條路線是從右邊走過去。哪一條路線更對呢?我不知道,但現實是不斷地技術迭代是降低眼前的產品技術難度的最佳方式。我希望不同的創業者透過不同的路徑攀登珠峰,最終在頂峰相見。

VITA的產品戰略

為什麼機器人難?為什麼機器人比大模型其實要難?
原因在於大模型只提供建議,而機器人要完成交付,這是這兩者之間最大的區別,而且也是他們之間價值和價格最大的區別。
VITA的產品觀是:“機器人的核心價值,是隨時隨地提供高質量的服務,而且是面向人的高質量的服務。”
因此產品的戰略上面,我們有幾個核心的認知:第一,垂直應用優先;第二,優先成熟的原理性技術;第三,去物理世界獲得多樣性且持續長的時間長的場景,然後透過室內室外分佈推進。

我們對於智慧機器人的產品定義是,它需要有面向家庭和C端個人使用者的產品設計,安全可靠存在於我們的生活空間裡,它可以非常智慧的去移動,使用者可以跟它有很好的互動。
仔細來說,智慧的移動是指全地形的移動能力。也就是說,我們能走到什麼地方,我們的機器人就應該能走到什麼地方。其次,是突破性的互動。一個機器人並不只是依賴於它自身去完成一些任務,而應該更像一個大的單品平臺,如此一來,它才有可能構建起一個巨大而且豐富的的平臺屬性。

我們想要打造的機器人將擁有個性化的外觀設計、可更換的配件、豐富的色彩和多樣的材質選擇,同時面向所有開發者開放介面。我們期待能與行業夥伴一起,共同構建一個圍繞機器人的豐富生態系統。
我們公司的名字叫"維他動力(Vita Dynamics)","維他(Vita)"象徵著智慧生命,"動力(Dynamics)"則代表了機器動力。這兩個詞的結合體現了我們的核心理念:透過創新AI研發,創造生活空間的智慧夥伴。
攀登科技珠峰的道路註定崎嶇,但當我們回望來路,那些在“春秋時代”播下的種子,終將在“戰國時代”綻放成改變世界的模樣。
尾聲:
從定義下一代終端標準,到分析產業發展階段特徵,再到提出"通用化"的實踐路徑,餘軼南博士的分享不僅明確了機器人作為"科技珠峰"的戰略地位,更給出了切實可行的攀登路徑。對於每一位躬身入局的探索者而言,這些洞見猶如指間沙金,閃耀而珍貴。

混沌時代,每一個創業者都是洞穴中的囚徒。
終其一生,我們都在努力走出洞穴。
凱文·凱利、彼得·聖吉、尤瓦爾·赫拉利、張首晟、周其仁、俞敏洪、左暉……
混沌老師用600多堂課為創業者支起火把,照亮前路。
掃描下圖,和混沌一起早半步認知這個世界:
