Figure:為人類部署數十億臺人形機器人

編譯:Lavida,zhoujin

編輯:Siqi
排版:Scout
本文編譯自 Peter H.Diamandis 和 Figure 創始人 Brett Adcock 的訪談。
Brett Adcock 是一位成功的連續創業者,在其創立的 eVTOL 公司 Archer Aviation 成功 IPO 之後,更早之前,他創立的 Vettery 則以 1 億美元被收購。今年年初,Brett Adcock  宣佈創立了通用人形機器人 Figure,並表示自己會投入至少 1 億美元到 Figure。Figure 的目標是開發能夠在不同環境中工作並處理各種任務的通用型人形機器人,從倉儲到零售,甚至看護服務。上個月,Brett 釋出了 Figure 的第一款通用人形機器人 Figure 01 行走的影片。
在本篇訪談中,Brett 分享了 Figure 01 是如何被設計的,以及他對於通用人形機器人領域的預期。Brett 認為人形機器人研發一定是軟硬體一體的過程,LLM 為機器人提供了強大的大腦,是軟體層面的重要補足,而硬體角度,幾乎沒有成熟的供應鏈可供使用,要求團隊在設計產品的同時就要考慮到機器人重量、計算處理、現實環境等細節。
Figure 最先開拓的商業場景是勞動力市場,Brett Adcock 表示相較於取代人類就業,人形機器人最大的價值是解決勞動力不足的現實情況,這些機器人可以被投入到經濟活動中做Dangerous, dull, dirty”的工作,讓體力勞動成為人類的一種選擇而非負擔。
以下為本文目錄,建議結合要點進行針對性閱讀。
👇
01 Figure 是什麼
02 如何設計一臺人形機器人
03 為什麼需要軟硬體一體開發
04 機器人會取代人類就業嗎?

歡迎關注

海外獨角獸

影片號

獲取最前沿的科技行業資訊
01.
Figure 是什麼
Peter:可以簡單介紹一下 Figure 嗎?你們的使命和目標是什麼?
Brett:Figure 是一家 AI 機器人公司,專注於設計自動通用人形機器人(Autonomous General-purpose Humanoids)。自動通用人形機器人是指具備自主能力,能夠自動執行多種任務,並且在外觀和行為上類似於人類的機器人。我們的目標是在長期能夠部署和人類數量一樣多的人形機器人,讓體力勞動成為一種選擇而非必然。
我們所處世界的作業系統是與人類相適應的,例如門把手、倉庫貨架,設計初衷都是適應人類的形態和能力,而通用人形機器人就是一個系統的通用介面(General Purpose Interface),可以直接與我們的物理世界互動。它的出現將為人類帶來諸多益處,有助於解決勞動力市場中的重要問題,例如提高人們在工作中的生產率,減輕家務和護理老人的負擔。我們的遠期計劃是在全球部署 100 億個人形機器人。
未來 1-2 年內,我們的重點將放在開發具有里程碑意義的產品上,希望在未來一兩年內,能向公眾展示大量人形機器人產品的研發成果,包括 AI 系統、低階控制(Low-Level Control)等,最終展示能在日常生活中發揮作用的機器人。
低階控制(low-level control))是機器人或自動化系統的基礎,它們負責處理底層的物理操作,主要包括運動控制、感測器反饋、即時響應、硬體控制等。
Peter:你預計到 2030 年或 2040 年,地球上會有多少個人形機器人?
Brett:在接下來的幾十年裡,我們真正面臨的挑戰將是如何擴大人形機器人的生產規模,以及如何將足夠數量的人形機器人供應到市場。長期來看,每個人、每個家庭都會想要一個人形機器人,就像現在的汽車或手機一樣。並且在勞動力市場上也會有數十億個人形機器人,去做那些對人類來說危險、單調和乏味的工作。人形機器人也將應用於航空事業,例如在太空中建立人類居住點、照看老人等各類工作場景。如果給我們足夠長的時間去進行大規模製造,我們可以製造出數十億個人形機器人。
短期內,人型機器人的效能以及可靠性是主要的限制因素,Figure 正在努力解決這個問題,我們希望能在兩年內完成實際生活的機器人應用測試演示。
Peter:

如果能成功降低製造成本、提高生產量,一個功能完善的人形機器人制作成本能降低多少?

Brett:如果我們回顧消費品或汽車行業的發展歷史時,可以看到產品的價格與生產量之間存在強相關。根據經驗曲線(Experience Curve),每當生產數量翻倍,產品的價格或成本就可能下降 20%或 30%。因此,我們可以認為價格取決於生產量。
Experience Curve
經驗曲線(Experience Curve)是一個經濟學概念,隨著個體或組織在特定領域的生產量增加,經驗的積累會帶來生產效率的提高,生產成本將會下降。
這個原理同樣適用於人形機器人的生產

。目前,一個人形機器人大約有 1000 個零件,重量約為 150 磅(68 公斤)。相比之下,一個電動汽車可能有大約 1 萬個零件,重量可能在 4000-5000 磅(1800-2250 公斤)之間。

因此,從長期來看,一個人形機器人的成本應該低於一臺廉價電動汽車。這主要取決於機器人的執行器、電機元件、感測器的成本以及計算成本。
Peter:關於生產速度,未來幾年內有可能生產幾百臺 Figure 機器人嗎?你預計到 2030 年會達到什麼水平?
Brett:現階段我們需要先打造出更成熟的產品,才能進一步考慮生產速度的問題。我們當前面臨的主要問題是確保人形機器人在客戶場景中的實用性、安全性和可靠性,讓機器人能夠持續執行,不出故障,並且不需要大量人員來維護和操作。否則,機器人的價值就沒法體現了。也無法為客戶創造理想的回報率。
如果我們能夠做到的話,我相信我們有能力在未來幾十年內生產數千萬個人形機器人。以 Tesla 和福特汽車為例,它們分別花了 10 年以上的時間生產並投放市場 100 萬輛汽車。如果我們的目標是全球範圍內投放 100 萬臺機器人,可能需要 5 年或者 10-12 年的時間。
與製造汽車相比,製造機器人的過程更加簡單。特斯拉 Model 3 有大約 1 萬個零件,而我們的機器人只有大約 1 千個零件,並且更輕巧。
因此,我認為在這 10 年的後半段,我們可以以相當高的產量進行機器人制造。但在接下來的 2-4 年內,我們的首要目標是製造出實用的人形機器人。
Peter:AI 已經能夠用於編寫其他 AI 程式了,你認為你們也會利用機器人來協助製造機器人,從而形成一種反饋迴圈嗎?

歡迎關注

海外獨角獸

影片號

獲取最前沿的科技行業資訊
Brett:

是的,

我們的目標是在製造過程中只有人形機器人來製造人形機器人

。我覺得在製造過程中任何需要人類勞動力的工作都會發生重大變革,我們上週參觀的汽車製造基地到處都有巨大的機器臂,數量多達數百個,那是我一生中見過的自動化程度最高的地方之一,但還有另外約 10,000 名員工在工作。

Peter:工廠製造應該是人形機器人最先投入應用的地方,機器人離家用還有多遠?
Brett:人形機器人會優先在相對更結構化的環境中得到應用,所以相較於複雜多變的家庭環境,工廠製造的產品具有更清晰一致的規格和引數,生產過程更易於統一和自動化,也更容易控制成本、保證安全性,因此工廠會是最初的應用場景。
為了讓人形機器人的操作技能、高階行為和感知策略更加成熟,我們需要將這些機器人投入到企業勞動力市場中,並建立一個全面的 AI 資料管道(AI data pipeline),這個過程需要時間。我的推測是預計到 2030 年左右,我們有可能看到人形機器人在家庭環境中的廣泛應用。
Peter:讓人形機器人成為可能的一個關鍵因素是 AI 能力的飛躍,而具有物理實體的 AI 機器人將在 AI 的進化中扮演重要角色。一個被裝在盒子裡或只能透過攝像頭或揚聲器觀察外界的 AI,與能真正與物理世界互動的 AI 有很大不同,你怎麼看?
Brett:我相信,最終我們將有能力對 AGI 產生重大影響。2023 年大家持續討論的一個問題是,在模型訓練和規模拓展中,一旦網際網路上沒有足夠的文字用來訓練新一代模型,AGI 是否還能實現?我認為,透過人形機器人與環境互動來獲取人類資料,並使用視覺語言模型來理解和處理這些資料,可能會是能持續推進 AGI 研究向前的一個主要途徑,雖然這可能需要更長時間。
Peter:Figure 的團隊是如何組建的?
Brett:我一直在努力找到世界上最優秀的人才,還有那些鮮為人知的小眾實驗室,以更深入地瞭解執行器或運動控制。同時,我也在看書學習全身逆動力學(whole-body inverse dynamics)或 NPC 控制器(NPC controller)等相關知識,我花了大量時間在這上面。
全身逆動力學(whole-body inverse dynamics)是機器人控制領域的一個概念,它涉及研究和計算機器人身體各部分的運動和受力情況,以便更好地理解和控制機器人的運動。這個概念通常用於開發機器人的動態控制系統,以使機器人能夠在執行任務時保持平衡、穩定和高效。
NPC 控制器(NPC controller)是一種用於控制機器人的控制演算法,它代表“非線性模型預測控制”(Nonlinear Model Predictive Control)。這種控制方法使用機器人的數學模型來預測未來的運動和行為,然後根據這些預測來生成控制命令,以實現所期望的機器人行為。NPC 控制器通常用於高階機器人應用,如動態步行、操縱和避障等領域,以提高機器人的效能和穩定性。
作為初創公司的創始人,最重要的是證明你能做出來產品,即使是一個最小可行產品(MVP),因為我們的目標都是推出產品或服務。

在創立 Archer 的時候,我在佛羅里達大學建了一個 372 平方米的 Archer Aviation eVTOL 實驗室,與一個博士團隊合作在那裡製造了第三、四代電動飛行器,這個過程讓我對技術原理和產品的認證決策(certification decisions)有了更深入的瞭解。

如果能事先知道 Archer 和 Figure 有多難,也許就不會有人去做了,因為它們確實非常有挑戰性。我當時完全沒有意識到供應鏈的成熟度問題,很多機器人的初創公司也是。他們可能會認為硬體採購很容易,真正的難題在於軟體,但實際情況並非如此。因為要讓軟體順利執行就需要優質的硬體,特別是對於 eVTOL 飛行器和 Figure 機器人,獲取硬體供應非常困難。
Peter:在 Figure 公司的發展過程中,有哪些技術層面的限制推動你做出了當前的決策?是電池壽命、材料重量或者 AI 嗎?
Brett:我們花了很多時間來了解需求,整個設計流程非常嚴格,也進行了大量的交易研究,確保我們能夠做出正確決策。
我們很多決定都取決於硬軟體的供應鏈情況,其中驅動器(actuator)、中介軟體(middleware)、作業系統、電池、控制軟體(control software)是主要的限制因素,一些情況下感知系統是比較容易獲得並內置於機器人中的。
我本來以為能很容易買到現成的,但市場上根本沒有好的驅動器、電池、控制軟體和中介軟體作業系統解決方案。感測器雖然有一些現成的,但我們幾乎都是自己製造下一代機器人的電子元件,並不是因為我們想,而是不得不。
Figure 研製的執行器(左) vs 
具有相同扭矩的現成執行器(右)
Source: IEEE Spectrum
02.
如何設計一臺人形機器人
Peter:Figure 機器人的身高是大概 168 cm,這個高度不會讓人類感到害怕,同時又足夠接觸到貨架頂層,你們在設計的時候是如何考慮的?
Brett:我們在設計機器人身高的時候經歷了一個複雜的決策過程,因為這個過程中的兩個決定性因素之間是互相矛盾的,我們需要在二者之間找到平衡。
一方面,從物理角度來看,機器人身高低於 168cm 是最理想的,因為這樣的設計可以降低能源消耗、增強穩定性,並且較矮的機器人部件更易於控制,並且在跌倒時能更快地恢復平衡。
然而,從商業實用性角度上,我們又需要機器人有足夠長的手臂、可以靈活從高處和低處獲取物品,就像“神探加杰特”(Inspector Gadget )中的機器人那樣具有超人的能力。
因此,綜合考慮這兩方面的因素,我們確定了這個高度作為理想身高。我們正在設計的下一代機器人會和第一代產品的身高保持一致。
Inspector Gadget 中擁有超長手臂的特工
Peter:你認為機器人有必要看起來和人類一模一樣嗎?
Brett:根據恐怖谷效應,當機器人的外觀越來越接近人類時,人們對它的信任感會增加,但是當它們過於接近人類時,人們會感到不安和恐懼。所以我們的目標並不是追求讓機器人在外觀上看起來像人類,比如說有五官和表情,而是希望機器人在功能上能夠模仿人類的操控和移動能力。這樣的話機器人就能夠執行需要與人類作業系統互動的任務。
這也意味著我們無需改變工作環境,就能將機器人投入到人類不願意從事的工作中,比如倉庫管理和製造業,或者做家務。這正是人形機器人的目的。我們的最終目標是讓機器人融入經濟活動中,從事對人類有用且有益的工作。
Peter:據你瞭解現在市場上有多少人形機器人公司?比如很多人都知道特斯拉的 Optimus 機器人,現在應該也聽說過 Figure ,你覺得還有多少公司像你們一樣募到了充足的資金來發展人形機器人?
Brett:我們關注到的應該已經獲得融資的有 6 個左右,過去十年大多數人形機器人專案仍處於研發階段,比如 Boston Dynamics 的 Atlas。美國也有許多非常優秀的實驗室,比如加州理工學院和 UC Berkeley 也展示過他們的一些研究成果。
商業化方面,我們會去看這幾個公司是不是商業化團隊,研發的機器人是否可以行走,以及有沒有手。據我們所知,目前只有我們和特斯拉的 Optimus 滿足這三個特質。
Peter:我們的 Abundance 360 CEO 峰會每年都會聚焦不同的機器人公司。幾年前我們邀請了波士頓動力的 Mark Robert,在峰會上演示了 Atlas 機器人。去年來自英國的 Engineered Arts 公司展示了 Ameca 人形機器人,她最大的特點是擁有面部表情,而且動作非常類似人類,雖然看起來有點怪,但讓人感覺很新鮮。Ameca 接入的是 GPT-4,Atlas 則是由自有系統驅動。可能大部分人沒有意識到的是,作為機器人,Atlas 實際上非常重,它的液壓系統非常危險。而你們在設計時採取了不同的方法,Figure 的重量相對較輕,不容易傷害到人,可以介紹一下它的其他引數嗎?
能實現表情功能的 Ameca 機器人
Source: Engineered Arts 
Brett:我們的目標重量是 60 公斤,而現在 Figure 的實際重量略高於 61 公斤,結果還是很理想的,因為我之前做的很多專案都有明顯的超重問題,比如 Archer拾象注:Archer Aviation 是 Brett 創立的一家專注於開發電動垂直起降(eVTOL)飛機的航空製造公司)。我們希望 Figure 在充滿電的狀態下能續航 5 小時,然後經過 ~2C 快速充電後再次投入工作。
C-rate(充電倍率)指充電電流相對電芯額定容量( Ah )的倍數,表示電池充電到最大容量所需要的時間,是衡量電池充電速度的一個指標,C 前面的數字越大,表示充電速度越快。1C 表示電池在一小時內可以充滿電,文中提到的 “2C 快速充電”就是說電池在半小時內可以充電到 100%。
另外就是讓 Figure 能以幾米/秒的步行速度快走,不需要跑步或衝刺,但有時候機器人可能需要在倉庫裡走大概 400 米,所以想讓他走快點。

我們需要透過一些特定操作實現快速、可靠和安全的目標,當前的硬體已經能夠完成大部分人類工作,主要的限制在於軟體。透過軟體更新,我們將會不斷提升機器人的能力。
Peter:我很興奮你們專注於讓機器人模仿人類形態。我對另一件事情非常感興趣,那就是與肌肉相關的硬體設計。我曾經讀過關於肌動蛋白和肌肉收縮等方面的文章,一直希望能研發出一種材料,只要施加電流就會像肌肉一樣收縮——這種材料將是人形機器人的理想驅動器,而不是傳統的旋轉或螺旋功能。你是否瞭解這方面的研究?我們是否有望看到電機肌肉技術(Electromechanical Muscle-tech)的發展?
Brett:人體的結構非常複雜,尤其是肌肉工作和關節運動。例如,人的肩關節有三個自由度,所以我們的機器人需要透過三個不同的執行器實現俯仰和翻滾,這些執行器被設計成按特定的順序依次啟用或啟動,以執行復雜的運動任務。要使機器人達到與人類相似的自由度和效率非常困難,所以在很長時間內,機器人與人類之間的差距將持續存在。
Figure 01 肩關節設計細節
Source: IEEE Spectrum
我們已經研究了很多種技術,包括液壓技術以及其他型別的執行器,而不僅僅侷限於旋轉或線性電機。我們的電機驅動器(Electromechanical Actuator)可以滿足各種需求,因為它們具有足夠的能量、動力和自由度以及合適的速度和扭矩來執行這些任務。只要能夠滿足需求,我們就可以進行大批次生產,從而大幅降低生產成本。

我們還在進行一些有趣的學術研究,但我們認為其中一些研究成果與實際應用還有距離,還不能將其應用到一個人形機器人上,並在未來幾年內進行有用的工作。
Peter:在 Figure 的設計中,資料處理和計算任務是都在機器內部進行,還是需要部分在雲端完成處理?
Brett:我們所有的短期、低級別的處理都在機身上操作,所以我們需要在機器人上整合足夠強大的計算和圖形處理能力,以便執行機器人內部的計算機,來驅動整個運動控制器、執行感知系統以及執行我們所需的各項功能。
我們的機器人也具備與雲端通訊的能力,因此對於一些不需要高頻寬、不必擔心延遲問題的任務,例如規劃機器人的下一步行動等高階行為,這些任務可以在雲端進行處理。
總體而言,我們希望在機器人上儘可能多地完成任務,例如在一個 5G 訊號不穩定的環境中,控制器仍能以非常快的頻率執行,所以我們的機器人需要具備在內部高速完成大量任務的能力。
Peter:關於機器人的視覺系統,你們的方案是什麼樣的?完全使用攝像頭視覺(Camera Visual)方案還是使用雷射雷達?
Brett:如果我們回顧消費品或汽車行業的發展歷史時,可以看到產品的價格與生產量之間存在強相關。根據經驗曲線的理論,每當生產數量翻倍,產品的價格或成本就可能下降 20%或 30%。因此,我們可以認為價格是生產量的函式。
Peter:你是否關注過《星際迷航》中的 Data 機器人以及 R2-D2 、 C-3PO?他們的哪些設計是值得借鑑的?哪些不太合理?
Brett:我喜歡 C-3PO,但我不太喜歡它手臂上帶有小型執行器的槓桿式裝置。R2-D2 的形狀和結構我覺得不太實用,後部的加速器可能有些用處。但其實我並不是《星際迷航》的科幻迷,我童年接觸更多的是阿西莫夫這些科幻作家的作品。
星際迷航中的 Data 指揮官
Source: Memory Fandom
R2- D2 讓我想到,很多人都建議我們給機器人裝上輪子,而不是採用雙足行走這種更復雜的方式。
《星球大戰》中的 R2-D2 機器人
Source: Wikipedia
但我認為固定輪距的設計是不合理的,儘管採用這種設計的機械臂在市場上表現出色,並且很多人也花了大量時間去實現這個設計。

考慮一個實際情況,如果我們讓一臺輪式機器人進入倉庫,它需要具備垂直移動的能力,這意味著它需要配備能夠上下移動的電梯。為了到達貨架的後面或者類似的地方,你需要先把它推向前方,然後再向後倒車。
為了完成這些複雜的動作,輪式機器人必須具備與雙足行走的機器人類似的複雜性、驅動力和自由度。因此,那些試圖讓我把機器人建造成 R2-D2 樣式的建議實際上是不切實際的。
03.
為什麼需要軟硬體一體開發
Peter:Oculus 的創始人 Palmer Lucky 最近在做一家國防科技公司,在外界看來,他們像是一個專注於硬體製造的公司,但實際他們做的大概是 60% 的軟體和 40% 的硬體。Figure 的硬體和軟體的比例如何?
Brett:如果包含做控制系統(control)、中介軟體(middleware)和自主決策與行動能力(autonomy)的人,我們的軟體佔比會比硬體稍微多一些,因為硬體 team 的員工只有 15 個左右,軟體規模要明顯大一些。
長遠來看,軟體會成為公司最大的業務板塊。Figure 作為一家專注於 AI 的公司,以後會有一個龐大的 autonomy 團隊,並且研發出關鍵的 AI 資料引擎。
但硬體方面也同樣重要。如果我們真的想做出實現高效能、高可靠性、高安全性和低成本的人形機器人,就需要開發自己的執行器、電子裝置、電池和幾乎所有軟體,因為這些都沒有現成的解決方案。做硬體我們經常說“唯一的出路就是繼續前進”,因為每次啟動機器人都會出現各種新問題,這確實是一項嚴峻的挑戰。
長時間從事軟體開發再進入硬體領域是真的很困難,研發硬體需要經過一個漫長的迭代週期,這也是我們受挫的主要因素。
Peter:LLM 如果能夠應用於人形機器人,我們就可以與機器人交流,讓它理解我的意圖,進行有效對話。你們打算訓自己的模型,還是會整合其他模型?在你們製造機器人的哪個環節會引入 LLM?
Brett:要讓人形機器人從工廠走進家庭,關鍵在於語言,所以 LLM 或視覺語言模型對我們的業務幫助很大。我們要讓機器人能夠從語義層面理解世界,做到理解和回應使用者的需求和指令,恰好 LLM 可以做到這點。
因此,我們會逐步將視覺語言模型加入機器人的研發過程,從高層次的行為角度來幫助人形機器人理解人類在說什麼,讓它能與人類進行對話,同時也能推斷和理解人們在說什麼以做出回應。我們很可能不會自己訓模型,但我們可以在機器人系統上訓練視覺語言模型,關聯感測器資料。
打造一個正確的 AI 資料引擎對我們來說非常重要,它能確保我們對機器人產生的資料進行準確的訓練,對神經網路進行正確的訓練,以便未來能夠有效地部署和使用。這也是驅動我們儘快讓產品進入市場的動力,我們希望將更多的機器人投放市場,收集資料,從而讓我們未來的機器人隊伍將變得更加智慧、學會更多技能。
Peter:人們沒有意識到機器人之間的 AI 和資料集是相互連線的,當一個機器人學會了如何執行某項任務,或者如何應對某種情況,不僅僅是那個機器人學會了,所有的機器人都會學到,這個是很棒的。
Brett:就像我的孩子們一樣,在他們學習做某件事的過程中,儘管可能失敗了很多次,但他們一旦掌握了就不會忘記,然後他們會不斷積累新的技能。
對於機器人也是一樣的,一旦我們成功地教會一個機器人如何成功地卸貨或處理特定情況下的箱子,整個機器人隊伍都會學到這個技能。因此,機器人的效能提升將非常迅速和顯著。
04.
機器人會取代人類就業嗎?
Peter:你預計市場最早什麼時候會看到 Figure 的第一個商業應用?
Brett:我預計會在明年,如果我們明年還做不到,那可能會延後一兩年,這是個比較理想的計劃。我們會盡量多釋出一些產品物料讓公眾瞭解我們的進度並獲得市場支援,這非常重要。我們計劃在未來 2-3 個月內釋出首個人形機器人在辦公室裡行走的影片。未來,我們還將在感知、操縱和其他傳統操作領域做更多工作。
Figure 01 動態行走
Source: Figure.ai
我們釋出影片的目的不僅僅是讓機器人展示花哨的動作,而是展示它在重複性工作中的出色效能。我們會把機器人放在倉庫裡,一遍又一遍地完成工作,我認為這才是具有突破性的進展。
我們目前正與客戶合作,看怎麼讓 Figure 在我們的實驗室中開始工作,並儘量模擬客戶的工作環境,這樣明年就可以更容易地將它部署到客戶的工作場景中。
Peter:高盛的預測是,未來 15 年內,機器人可能會創造 1540 億美元的收入,你也提到過全球 GDP 的一半來自勞動力,這是 Figure 的潛在市場。是否有人擔憂機器人尤其是人形機器人的出現會導致人們失去工作,引發類似於 AI 引起的就業問題?
Brett:我的觀點是在接下來的 10-20 年裡,機器人業務的發展將與自動駕駛汽車的發展路徑類似。就像自動駕駛汽車,高速公路的測試影片會比城市街道的更早公開,是因為城市街道有更高的安全要求和更多的不確定性。
同樣,人形機器人也會首先解決相對容易的問題,比如在預知環境和任務的情況下搬運貨物。這類任務就像在高速公路上駕駛,相對簡單易行。然而,更復雜的任務,例如在家中烹飪或照顧老年人,就像在城市街道上駕駛,更具挑戰性。
Source: Figure Master Plan
儘管大家對人形機器人的期望往往集中在複雜任務的解決上,比如谷歌的機器人做垃圾分類,豐田研究院在雜貨店等場景的研究,但這些都是非常困難的挑戰。我很高興有這些研究,但

從商業角度出發,我們的首要任務應該是解決那些簡單但必要的問題,然後逐漸將 AI 資料引擎應用到更復雜的任務中。

所以 Figure 和其他研究團隊關注的事情恰恰相反。我們的目標是在倉儲製造領域應用人形機器人,這個領域的勞動力短缺問題最為嚴重。全球約一半的 GDP 來自勞動力,我們正在面對全球範圍內的勞動力短缺問題。隨著嬰兒潮一代的退休和生育率的下降,這個問題將越來越嚴重。
Peter:大家沒有意識到,我們面臨的最大挑戰不是人口過多,而是人口不足。
Brett:這必然會是一個重大問題。我們有時候去拜訪客戶,比如一個大型財富 100 強公司時,他們首先考慮的不是如何讓機器人與員工協同工作,而是讓機器人解決勞動力短缺的問題。去年他們的倉庫員工流失率高達 140%,因為沒有人願意做這些危險且冬冷夏熱的工作。
Peter:未來幾年內,你是否會把所有機器人首先投入到倉庫環境中,讓它們從事包裝、解包、貨運和物流等工作,並且著重去提升在這些場景下的能力?
Brett:我們現在大部分時間都投入到了機器人在物流方面的應用,也在一些大型汽車製造商(OEMs)上花費了不少時間,這些製造商的生產設施需要大量員工來操作。上週我們去了一個美國著名 OEM 的廠房,那裡有近 1 萬名員工。他們問題很多,人手不夠,很多工作都很危險,工人在機器旁做點焊工作,你都可以聞到焊接煙霧的味道。
在訂單履行和物流操作的領域內也存在很多問題,因為它們需要及時進行庫存管理。我們看到每天大約有四、五百萬個零件需要人工處理,都集中在同一個設施或同一位置,這個任務量是很龐大的,此外還有大量的鋼板被移動到不同的機器上,員工需要在數百個工作站做點焊這種重複工作。
Peter:工廠是 7 × 24 無休,還是每天 8 小時?
Brett:不,他們是每天運作 21 至 22 個小時,有兩個 10 小時的班次。
Peter:所以這些機器人可以在沒有人員干預的情況下全天候工作,不需要像人類員工一樣進行藥物測試,也不需要提供假期和保險。對於這種工種,如果有一個良好的 PMF,機器人是非常理想的勞動力。
Peter:接下來你是否計劃進軍物流、倉儲和送貨服務領域?你認為下一個潛在的大市場是什麼,我們何時會看到這些人形機器人出現在這個領域?
Brett:我們計劃先在未來十幾年內持續擴大在商業勞動力市場的規模。我們關注的領域包括醫療保健、房地產、建築和零售等,我相信這些領域都有巨大的市場潛力。
另外,還有一些市場尚未應用人形機器人,比如房地產。科技房地產公司開發的線上平臺可以使用人形機器人來代替人類經紀人提供服務。人們可以透過訪問網站預約看房,然後由人形機器人開啟門迎接他們,在一個虛擬的房屋中全程介紹。這是一個價值數萬億美元的市場,但科技公司迄今為止還未涉足,因為目前房地產領域的工作仍然過於依賴人力。
此外,還有許多行業的工作可以透過遠端操作或其他技術來完成,人形機器人可以為這些行業帶來新的發展機會。
Peter:我個人很期待人形機器人進入支援老齡人口的市場,這也是一個相對迫切需要補充勞動力的市場。如果我們希望讓機器人為老年人提供高質量的看護服務,需要哪些技術上的突破和創新?
Brett:這需要我們的人形機器人具備足夠的可靠性、安全性以及合理的成本。從硬體的角度來看,這種機器人將能夠執行在家庭環境中所需的幾乎所有工作。在商業市場上,我們需要建立對產品的信任和其他方面的成熟度。
透過將人形機器人應用於擁有大量勞動力的大型企業中,提高機器人的智慧性、靈活性、可靠性,最終進行大規模生產以降低成本。機器人在老年護理領域的應用將在大約十年後發生,並且非常重要,甚至可能創造更大的市場。但這只是我們計劃的第二步,而第一步是商業市場。
Peter:當 Figure 發展到第 5、6、7 代的時候,是否會出現一個擁有面部特徵和個性的人形機器人,從而增加使用者的舒適感?有面部表情的機器人可以讓人感覺到它們與你建立了連線。隨著 AI 朝著 AGI 的方向發展,識別使用者的情感狀態並傳達情感回應的能力將會變得越來越重要。你對此有什麼看法?
Brett:我們完全可以做到這一點。我們的機器人頭部今天已經有了一個全封閉的螢幕,可以傳遞資訊,告訴使用者機器人正在做什麼,還可以提供提示等等。我們在頭部還配備了攝像頭和各種感測器。無論我們的機器人是照顧者還是在為企業提供服務,都可以向用戶傳遞面部表情資訊,以使他們感到舒適。
Figure 01 頭部可傳遞資訊的全封閉螢幕
Source: Figure.ai
現在 NLP 已經足夠成熟,可以讓機器人與使用者進行對話性的交流。我們也可以讓機器人的外觀看起來更舒適。考慮到我們的業務還處於早期階段,我們需要花費很多時間來實現。如果可以,我們一定會向消費者提供這樣的體驗。
Peter:我們聊了工業物流、製造業還有醫療保健,你最期待的下一個重要市場是什麼?
Brett:我真的很願意在消費者領域、家庭領域和照顧老年人方面提供幫助。長期而言,這些是非常重要的業務,每個人都會擁有一個人形機器人作為助手來做事情。而另一個並沒有得到很多關注的市場是,我認為人形機器人將會被應用於宇宙探索。
Peter:你提到了我要說的領域,太空探索。
Brett:我們正處在太空探索的黃金時代,這讓我感到非常興奮。這是由於正在建設的基礎設施為火箭發射提供了支援。我認為人形機器人將是一個對人類非常有幫助的工具,可以幫助我們在月球和火星等地建立居住地。
延伸閱讀

相關文章