作者:彭昭(智次方創始人、雲和資本聯合創始合夥人)
這是我的第353篇專欄文章。
智慧代理(AI Agents)似乎成為了OpenAI的下一張“王牌”。根據彭博社的報道,OpenAI口中代表AGI通用人工智慧第3階段的智慧代理,將於2025年1月釋出。
OpenAI的CEO Sam Altman在最近一次訪談中提到:“智慧代理將是AI發展的重要方向,它可以讓AI系統像人類一樣完成複雜任務。”
毫無疑問,智慧代理是2025年確定的熱點,Anthropic、谷歌、微軟等公司已經紛紛介入。
另外我們還需要關注到,未來AI的真正風口可能並不在軟體行業,而是在硬體行業,特別是消費級AI硬體的興起。
事實上,以OpenAI為代表的生成式AI企業,正在積極地向物理世界擴充套件。
與虛擬世界的大型語言模型不同,這些AI硬體並不需要強大的計算能力,而是透過端側小模型實現特定任務的智慧代理功能。
儘管目前小模型在物理世界的應用還處於起步階段,但其潛力不容小覷。相比軟體領域,硬體領域的AI應用往往更加貼近使用者需求,能夠解決人們在日常生活中的實際痛點。
這些智慧代理不僅能夠感知環境、做出決策,還能夠主動與世界互動,甚至參與經濟活動。這種全新的AI形態,有望在未來徹底改變我們的生活和工作方式。
隨著智慧代理的發展,我們有理由相信,萬物智慧AIoT 2.0的時代正在加速到來。
在這個“萬物經濟”的時代,智慧裝置不再僅僅是資料的生產者,而是能夠主動參與交易。無論是實體智慧硬體,還是虛擬智慧代理,都有可能自行發生交易,甚至參與複雜的經濟決策過程。
在本文中,我們將深入探討智慧代理在虛擬世界和物理世界的發展趨勢,並分析其對於推動萬物經濟發展的意義。
2025智慧代理大戰一觸即發
作為AI行業的領導者,OpenAI正在一步步推進AGI的發展,並將智慧代理列為實現AGI的第3階段。同時,該公司制定了明確的釋出時間:2025年1月。
據彭博社報道,OpenAI正準備釋出一款名為Operator的自主智慧代理,該代理能夠控制計算機並獨立執行任務。該公司計劃於1月份首次將其作為研究預覽版和開發工具亮相。
在此之前,AI領域的另一主要參與者Anthropic已經推出了自己的智慧代理功能:Computer Use。這款智慧代理用途廣泛,例如有使用者使用它規劃出行線路,如下圖所示。

谷歌也沒有落後,DeepMind部門最近釋出了名為Project Mariner的研究模型,這是谷歌首個能夠在網頁上執行操作的AI代理。此外,為了幫助合作伙伴和開發者在商業化智慧代理上取得成功,Google Cloud還發布了一系列激勵計劃。
由於眾多巨頭都參與了競爭,目前還不清楚OpenAI的Operator是否會比競爭對手具有顯著優勢。但毫無疑問,智慧代理將成為生成式AI的下一步發展重點。
根據彭博社的描述,OpenAI將AI的能力分為5個階段:聊天機器人、推理者、智慧代理、創新者和組織建設者。

第1階段:
Chatbots聊天機器人,可以用自然語言進行流暢的對話;
第2階段:
Reasoners推理者,AI能夠在廣泛的領域進行“人類博士水平的問題解決”,而不是特定於一兩個任務;
第3階段:
Agents智慧代理,AI開始具備在沒有人類輸入的情況下建立內容或執行操作的能力,或者至少在人類的指導下執行;
第4階段:
Innovators創新者,AI變得更具創新性,能夠做“輔助發明”,而不僅僅是從已有的知識中汲取;
第5階段:
Organizations組織建設者,AI模型能夠在沒有人類干預的情況下獨立執行整個組織,此時則達到了AGI的水平。
OpenAI認為,目前的AI模型正處於第一階段,即將進入第二階段“推理者”,而邁向的第三階段正是智慧代理。
人工智慧代理的核心是自主和自治軟體,可以規劃、執行任務並實現特定目標,無需人工干預。那麼,人工智慧代理與我們在網際網路上常見的聊天機器人有何不同呢?

智慧代理的核心特徵使其成為連線人工智慧與區塊鏈技術的橋樑,從根本上顛覆了傳統智慧系統的功能和定位。相較於傳統AI系統,智慧代理具有以下突出特點:
1、自治能力
智慧代理的自主性是其最顯著的特徵之一。與需要明確指令的傳統工具型AI不同,智慧代理可以獨立感知環境並採取相應行動。透過強化學習和行為規劃等技術,智慧代理可以根據當前資料或輸入自動做出決策。
智慧代理的自主性是其最顯著的特徵之一。與需要明確指令的傳統工具型AI不同,智慧代理可以獨立感知環境並採取相應行動。透過強化學習和行為規劃等技術,智慧代理可以根據當前資料或輸入自動做出決策。
2、反應性
反應性是指智慧代理對外界環境變化快速響應的能力。透過先進的感知系統,智慧代理可以即時捕捉環境變化並快速調整行為。
反應性是指智慧代理對外界環境變化快速響應的能力。透過先進的感知系統,智慧代理可以即時捕捉環境變化並快速調整行為。
3、學習能力
智慧代理的學習能力體現在不斷適應和最佳化自身行為的能力。透過整合深度學習和強化學習技術,智慧代理可以根據環境反饋提高決策的準確性和效率。
智慧代理的學習能力體現在不斷適應和最佳化自身行為的能力。透過整合深度學習和強化學習技術,智慧代理可以根據環境反饋提高決策的準確性和效率。
4、社交能力
這種社交能力的核心在於去中心化網路中的智慧協作。社交能力的增強也為智慧代理在元宇宙和現實世界中的應用提供了廣闊的可能性。
這種社交能力的核心在於去中心化網路中的智慧協作。社交能力的增強也為智慧代理在元宇宙和現實世界中的應用提供了廣闊的可能性。
這些特點使智慧代理能夠獨立感知環境、快速響應變化、不斷學習最佳化,並與其他智慧代理或使用者高效協作。
智慧代理:從虛擬到現實的商業應用

根據研究機構的預測,到2030年,智慧代理的市場規模將達到471億美元,複合年增長率為45.1%。這表明智慧代理的興起才剛剛開始,隨著這些工具的發展,它們可能會徹底改變家居、出行、客戶服務、醫療保健、教育等行業。
想象一下,在未來的世界裡,你不必花時間管理電子郵件或研究任務,因為你的人工智慧助手會替你處理。智慧代理的應用可能性無窮無盡。
值得注意的是,智慧代理的商業應用並不侷限於虛擬領域,而是延伸到了實體世界。
OpenAI等公司始終堅持在物理世界進行探索,近年來持續投資與其技術路線相符的初創公司,如機器人公司Figure、1X Technologies以及Physical Intelligence。
這三家公司各有特色:1X Technologies釋出的最新雙足人形機器人原型一度被網友質疑是真人扮演;Figure AI釋出的第二代人形機器人Figure 02被稱為“全世界最先進的AI硬體”。

Figure和1X Technologies雖然均屬人形機器人公司,但是路線差異較大。1x將其機器人直接帶入人們的家中,旨在徹底改變家庭生活,而Figure則專注於工業應用,如汽車製造,以提高效率和安全性。除了市場方法之外,這兩家公司在技術上也有所不同:1x採用基於肌腱的機器人,而Figure僅依靠執行器。
Physical Intelligence則致力於將通用人工智慧技術應用於物理世界,目前正開發能夠驅動當前機器人技術及未來物理裝置的基礎模型和學習演算法。

在OpenAI的最新一輪融資中,軟銀的孫正義顯然看到了智慧代理在物理世界應用的一些端倪。他認為,在不久的將來,人工智慧技術將覆蓋整個家庭,智慧代理可以實現健康狀況監測、主動呼叫醫生、執行日常購物、完成各種預約任務以及輔導幼兒等功能。
AI技術的發展具有多維度影響,特別是在硬體領域蘊藏著巨大潛力。未來AI的真正風口可能並不在軟體行業,而是在硬體行業,尤其是消費級AI硬體的興起,可能會成為下一波創新浪潮的核心。
雖然當下AI技術的熱潮主要集中在軟體領域,但真正的突破可能會發生在硬體領域。消費者不僅需要AI軟體提供的智慧服務,更需要這些服務能夠透過硬體產品的物理形態融入到日常生活中。
AI驅動的家庭機器人、智慧家居裝置等例子表明,這些消費級硬體將成為AI技術走進千家萬戶的關鍵。
最近市場上出現了許多創新產品,如百度推出的小度AI眼鏡,據說其中搭載了端側模型。在教育類硬體中,也嵌入了一些小型模型,甚至是特別小的模型,如翻譯筆、詞典筆,甚至耳機等。以前我們認為這些裝置太小、算力太弱,無法執行小模型,但現在有些廠商已經將特別小的語言模型整合進去。
未來,我們可能會看到更多可以與家庭成員互動的智慧裝置,它們能夠根據使用者需求提供個性化服務,並不斷學習和進化。這些創新產品不僅是技術的展示,更是實用性的提升,能夠真正解決日常生活中的痛點。
AI消費級硬體創新可能正是許多企業忽視的“藍海”。與軟體應用相比,硬體創新面臨的技術壁壘和市場挑戰要大得多,但也因此蘊藏著更大的機會。如果能夠突破這些壁壘,開發出具有高度實用性的產品,便有可能引領下一個技術潮流。
端側有很多這樣的例子,特別是一些嵌入式裝置已經能夠執行小型模型。未來,我們會發現越來越多的端側裝置,如眼鏡、手機、PC等,將內建越來越多的小模型,它們將無聲地影響著我們的生活。
智慧代理+Web3:推動萬物經濟發展的關鍵力量

隨著人工智慧技術的不斷進步,智慧代理將成為推動萬物經濟發展的關鍵力量。
智慧代理不僅能夠自主感知環境、做出決策,更重要的是,它們能夠主動參與資料交易,為商業化應用提供新的可能性。
在萬物經濟時代,智慧裝置不再僅僅是資料的生產者,而是能夠根據自身需求和目標,自主地參與資料交易。這種交易可以是裝置之間的直接交易,也可以是裝置與其他經濟主體之間的交易。智慧代理正是實現這一願景的關鍵所在。
然而,智慧代理距離真正可用還有諸多挑戰需要克服。作為新型生產力,智慧代理需要搭配Web3這種新型生產關係,才能真正進入大眾視野。
智慧代理需要成為獨立個體,擁有獨立的財務賬戶,可以自主執行任務。如果我們希望智慧代理可以自主執行任務,那麼其必然需要一個自主“身份”,作為一個獨立個體存在。在Web3中,為智慧代理註冊一個鏈上身份和鏈上錢包,是非常自然而然的事情。
透過賦予智慧代理自助交易的能力,我們可以構建一個高度自動化、高效運轉的經濟系統。在這個系統中,智慧代理可以根據自身的任務和目標,自主選擇交易物件,談判交易條件,並完成交易過程。這不僅可以大大提高經濟活動的效率,還可以促進資源的最佳化配置,推動商業模式的創新。
舉個例子,假設一個智慧代理控制的自動駕駛汽車在行駛過程中發現自己的電量不足,它可以自主尋找附近的充電樁,並與之進行交易,支付相應的費用來獲取電力。這整個過程無需人工干預,完全由智慧代理自主完成。類似的場景在萬物互聯的未來將變得司空見慣。
當然,要實現這一願景,還需要在技術、法律、倫理等多個層面進行探索和完善。我們需要開發更加智慧、更加安全的智慧代理,建立健全的資料交易機制和規範,確保交易過程的公平、透明和可信。同時,我們也要重視智慧代理的倫理問題,確保其行為符合人類社會的價值觀和道德準則。
相關公司已經開展了很多探索。比如,Fetch.ai與博世公司正在使用智慧代理AI建立能源社群,使用者可以在其中共同管理、共享和交易可再生能源。
智慧代理即時監控能源生產和消耗,動態分配資源,確保能源得到最佳共享,從而最大限度地減少浪費並提高成本效率。社群成員透過分散的P2P市場交易剩餘能源,由智慧代理確保最佳交易並透過智慧合約實現交易自動化。該解決方案可降低社群的能源成本,透過本地能源生產提高恢復能力,並減少碳排放,使可再生能源更易於獲得,併為所有人帶來回報。

沃達豐與住友公司合作建立了Pairpoint,這是一個允許裝置使用由移動SIM卡和區塊鏈保護的錢包和支付技術進行無縫、安全的交易的平臺。
例如,平臺可以允許電動汽車直接連線充電站並協商充電金額和費用;汽車可以與交通管制系統進行交易以獲取有關當地交通流量和擁堵的資訊;或者貨運集裝箱可以向港口當局提供他們在出口商、進口商或貨運承運人之間交換貨物所需的所有資訊。
除了安全自動支付的便利性之外,萬物經濟還將開啟需求方直接響應的可能性。
從汽車、公交、火車到航運、能源和零售,機遇遠不止電動汽車和充電站之間的交易,還可以直接透過車輛支付過路費和停車費,而使用公共交通的旅客可能不必提前付款或刷卡進出。
在航運領域,貿易公司不僅能夠追蹤其產品,還可以向海關核實集裝箱和包裹內容,並自動支付所有應繳關稅。
在家裡,家庭可以授權太陽能發電機根據需求自動向電網出售多餘的能源。在街上,零售商可以調整價格,在非高峰時段為購物者提供即時折扣。
總之,智慧代理自助交易的實現,將標誌著萬物經濟發展進入一個嶄新的階段。
寫在最後
智慧代理和Web3的結合,正在為萬物經濟開啟一扇通往未來的大門。
隨著技術的不斷進步和應用場景的不斷拓展,我們有理由相信,這兩大熱點的碰撞將釋放出前所未有的能量,推動人類社會邁向一個全新的智慧時代。
在這個時代,每一個物體都將擁有自己的智慧代理,它們能夠自主學習、自主決策、自主交易,與人類形成更加緊密、更加高效的協作關係。這不僅將極大地提升生產力和資源配置效率,還將從根本上重塑我們的經濟形態和社會結構。
參考資料:
1. Crypto x AI Agents:網際網路新正規化的最後一塊拼圖,作者:starzq.eth,來源:X
2. Exploring the Future of AI Agents in Crypto,來源:Binance Research
3. AI+物聯網+Web3,3大科技力量催生萬物經濟2030,來源:物聯網智庫
2. Exploring the Future of AI Agents in Crypto,來源:Binance Research
3. AI+物聯網+Web3,3大科技力量催生萬物經濟2030,來源:物聯網智庫


