

必要的泡沫。


文|於麗麗
來源|暗湧Waves(ID:waves36kr)
封面來源|IC Photo
當下的具身智慧賽道正陷入某種奇觀。
一邊是朱嘯虎這樣的投資人高調逃離泡沫,一邊是這個在去年年末就被很多投資人預判為“下注視窗期已結束”的方向,屢屢被高額融資啟用。
這其中,除一些新入局的智駕背景公司之外,還包括去年估值就大幅飆升的一些公司。騰訊最新押注的智元機器人,就是最受矚目的之一。而這也是騰訊投資在具身智慧領域的首次押注。
早在2023年,這家由原華為計算產品線總裁鄧泰華和“華為天才少年”稚暉君等人建立的公司,就創立過成立僅1月即完成3億天使輪融資的記錄。非但如此,它還在之後幾個月內,估值快速抵達10億美金,成為全球最快躋身獨角獸的一傢俱身智慧公司。
在中國頭部幾家具身智慧公司中,智元無疑是最高舉高打的一家。市面也從不缺少它的聲音。
繼3月釋出首個通用具身基座大模型後,智元又宣佈與具身智慧公司 Physical Intelligence(Pi)達成合作關係。牽線人恰是昨天宣佈加入智元的首席科學家:羅劍嵐。
據瞭解,羅劍嵐曾在Google X、Google DeepMind從事研究工作。在伯克利人工智慧實驗室(BAIR)做博士後期間,他曾是深度強化學習領域重要人物,Pi創始人之一的Sergey Levine 教授團隊的核心成員。
關於自己為什麼加入智元,以及外部對於具身智慧賽道的諸多誤讀,羅劍嵐和幾家媒體一起做了分享。以下是其中部分問題的摘錄,經暗湧編輯整合。

笑到最後的
一定是軟硬體一體的全棧路線
提問1:因為朱嘯虎的逃離,現在很多人覺得具身智慧已有大量泡沫。
羅劍嵐:泡沫本質上也意味著關注度和資源,是提前下注。大筆資源,一湧而上,到了某個點,發現預期達不到,就開始往下降,可能過一陣再開始往上升,這是非常正常的。
每一次技術正規化的轉移都會經歷這種階段,像自動駕駛也如此。自2016年Waymo始,自動駕駛到現在才真正看到可以商用、落地的曙光。具身智慧,是一件更復雜、系統的事,決定了它需要更長時間技術積澱,而不是靠算力或模型堆疊就能突破。
提問2:具身智慧的火熱,最關鍵變數是大模型嗎?
羅劍嵐:把具身過度類比大模型範式,是外部關於這個行業最大的誤讀。
兩者有相似之處,大模型有些技術也可以遷移到具身和機器人上,但不能簡單的劃等號。
比如,像大模型LLM有百分之五六十的準確率就可以用。因為你有人的大腦,ChatGPT讓你去喝農藥,你不會喝,因為你可以自己判斷。但在機器人身上,這個準確率一點用都沒有。
想象一下你的家庭機器人每三個小時,把你家的茶几上的杯子摔一次,把你的手機往窗戶上丟一次,或者送咖啡的機器人每20分鐘把咖啡隨意潑一次。就像智駕,跟十年之前相比,完全兩個物種,成功率已經很高, 但大家還是會要更高。因為每一個類似的失敗動作,都會有一個物理世界的後果。
所以用大模型的週期去類比具身,是低估了作業智慧和行動智慧的獨特挑戰。
提問3:隨著不同階段的演進,大模型代表的軟體部分和涉及製造的硬體部分,重要性會有哪些變化?
羅劍嵐:軟體和硬體同等重要。目前軟體沒有收斂到點,硬體也沒有收斂到點,關於兩者如何整合,目前行業也沒有共識。
提問4:在軟體和硬體上,目前最關鍵的卡點分別是什麼?
羅劍嵐:軟體方面,大模型雖然強,但還沒有長時間memory ,在跨任務嘗試,分層控制和即時反饋上,都是難題。用不用模擬,需要多少真實資料,多少合成數據,都沒有定論。包括用不用RL,因為RL在真實世界用的話,樣本效率、訓練穩定性、還有泛化能力,都是挑戰。
硬體像一些高效能的硬體平臺,成本還是很高,有些感測器反饋不夠精細,像觸覺感測器就沒有到一個成熟狀態,還有可靠性,都有很大提升空間。
目前也有很多本體,方案,包括執行器。我覺得後面不會是一個本體解決所有問題,而是根據不同行業,有幾個相對標準化的本體,有一個方案。
提問5:資料問題好像是爭議最大的,但這也很像一個蛋生雞,雞生蛋難題。
羅劍嵐:對,看起來像頭尾在迴圈。沒有資料,沒到一定程度,也很難把機器人部署到真實世界。
但你設想下,如果1000臺機器人在星巴克,24小時乘以7的時間裡,打咖啡送咖啡,一個月傳回來的資料,也能超過現在我們見過的機器人資料集的scale。
而且機器人和汽車還有一個區別,汽車如果沒有100%的把握,你很難拿到真實世界去,因為車的安全性各方面太嚴格。
但機器人可以先從一些封閉、半封閉空間開始,有百分之七八十可能性就可以轉起來,這樣就可以把更多資料傳回來,來improve這個系統。
提問6:自動駕駛早期也有過很多關於資料問題的討論。
羅劍嵐:自動駕駛2016年剛開始時,也因為資料匱乏,有過很多爭論。但現在是資料太多了,特斯拉去年公開的路上資料是500億英里,資料中心都已經裝不下了,所以我們應該擔心的不是有沒有多少資料,而是應該做哪些演算法設計,把資料更好銜接起來。所以,那些掌握產品和生態,有能力自己去部署機器人的具身智慧公司,先發優勢會很大。
提問7:在你看來,軟硬一體的全棧路線是必要的嗎?有的公司就只想做好本體部分。
羅劍嵐:自動駕駛早年,也有專做大腦的,但現在主機廠都開始做自動駕駛。十年前,無人機很火時,中美出現一大堆無人機公司。美國公司說不做硬體,記得當時好像英特爾在美國開了20多個實驗室,就做這個無人機導航線這些東西,當然這也因為美國沒有製造業,沒有產業鏈,所以只能做大腦,但現在這些,你都記不住了,因為他們都已不存在。我們現在記住的名字是:DJI(大疆)。
雖然只做大腦也可以跟硬體結合一起,但我認為一定是軟硬體一起迭代的全棧路線,會笑到最後。

如果機器人真的實現manipulation
這就是AGI

最佳時間點








