
新智元報道
新智元報道
編輯:犀牛
【新智元導讀】隨著AI智慧體的爆發,Browser Use異軍突起,剛剛融資1700萬美元。它能讓AI智慧體輕鬆地「讀懂」網站並自動完成複雜任務,引領了一波AI應用熱潮。
AI智慧體可能還沒有一個大家都認可的定義,但這並不妨礙一大堆創業公司爭相打造智慧體工具,來自動化處理各種任務。
其中一家名為Browser Use的公司尤其吸引開發者與投資人的關注,因為他們的工具能使智慧體更容易地「讀懂」網站。
據最新報道,Browser Use剛融了一筆1700萬美元的種子輪資金,由Felicis的Astasia Myers領投,Paul Graham、A Capital和Nexus Venture Partners跟投。此次融資之前還沒被報道過。

網站地址:https://browser-use.com
Browser Use是Y Combinator 2025冬季班的一員,最近幾個月隨著智慧體的爆火而名聲大噪。
尤其是火出圈的Manus也用了Browser Use工具,一下子就把它的知名度推到了新高。
Browser Use的創辦人是Magnus Müller和Gregor Zunic,他們去年透過蘇黎世聯邦理工學院的創業加速器創辦了這個專案。
Müller多年來一直在研究網頁抓取工具,2024年他在讀資料科學碩士時認識了Zunic。Müller說,他們倆一塊兒琢磨出了把網頁抓取和資料科學結合起來的想法,打算讓瀏覽器自己完成任務。
Müller和Zunic花了五週時間做出了個Browser Use的demo,結果一炮而紅。後來,他們乾脆把Browser Use開源了。

簡單說,Browser Use是把網站上的按鈕和元素拆解成一種更容易理解、更像「文字」的格式給智慧體用。
這能幫助AI智慧體搞清楚網頁有哪些選項,然後自主做出決策。
「好多智慧體靠的是視覺系統,透過截圖來瀏覽網站,但這過程中老出問題。」Müller說,「我們把網站轉化成智慧體可以理解的東西,這種方法能讓我們以更低的成本反覆執行相同的任務。」
隨著越來越多的AI公司想讓他們的智慧體跟網站互動得更順暢,Müller覺得Browser Use能成為滿足這些需求的「底層技術」。
他還表示,現在Y Combinator冬季班裡有20多家公司都在用Browser Use滿足自己的需求。
有些公司還跑來問他們,怎樣才能使得智慧體更容易地瀏覽自己的網站?
Müller說,「像LinkedIn這樣的網站,總是改變網站的功能,智慧體在這種情況就經常出錯。」
Felicis的Myers說,他們過去幾年一直在關注AI智慧體領域,而Browser Use就是一個很好的投資機會。
她說,Browser Use的創始團隊——以及他們開源為先的策略——徹底打動了自己。
「我們覺得網頁AI智慧體是下一個前沿技術,能真正使得人類任務實現端到端的自動化,」Myers對TechCrunch說,「網頁AI智慧體就像是一座動態橋樑,連線著靜態預訓練模型與不斷變化的數字世界,而這些靜態模型往往只專注於文字。」
Browser Use:讓智慧體簡單地瀏覽網頁
Browser Use可以使AI智慧體簡單地瀏覽網頁。
它在GitHub上開源,許多專案都使用了它的功能,目前已經獲得超過47k個Star了。

專案地址:https://github.com/browser-use/browser-use
Browser Use透過提取網站的互動元素(如按鈕、表單等),使AI能夠自動化執行瀏覽器操作,例如填寫表單、搜尋資訊或導航網頁。
這對於開發AI驅動的網路智慧體非常有用。
比如,它可以將商品新增到你的購物車,並完成結賬。

甚至是閱讀你的簡歷,然後幫你找工作!中途如果有需要,還會停下來等待你的指示。

它也可以幫你幹活兒。
比如,讓它在Hugging Face上查詢具有cc-by-sa-4.0許可證的模型,然後按點贊數排序,將排名前5的模型儲存到檔案中。

從MCP到Browser Use的爆火
Browser Use是隨著智慧體的快速發展而爆火起來的。
去11月,Anthropic首次提出「模型上下文協議」,即MCP,賦予了Claude模型超級能力,一次構建,讓AI與工作流深度整合。
用通俗的話講,MCP就像是專為AI應用設計的通用介面,類似我們日常使用的USB-C。
正如USB-C簡化了不同裝置與計算機的連線方式,MCP簡化了AI模型與資料、工具和服務之間的互動方式。
透過MCP,AI助手不僅能夠「讀懂」程式碼,還能「理解」團隊討論、涉及文件等外部資訊,提供更加精準的回答。

今年1月,OpenAI推出了Operator,能夠自主執行網路任務,如規劃假期、填寫表單或預訂餐廳 (OpenAI Launches Operator)。
Operator使用名為Computer-Using Agent (CUA)的AI智慧體,透過視覺介面控制網頁瀏覽器,模擬人類點選、輸入和滾動的操作。
這一工具展示了AI智慧體在網路任務自動化中的潛力,但也需要使用者在遇到複雜介面或驗證碼時介入。

差不多同一時間,Browser Use也開源了,它被Manus團隊整合到了Manus智慧體中。
Manus因其綜合能力和友好的使用者介面(如即時顯示思考過程)而迅速走紅,吸引了大量關注。
這直接推動了Browser Use知名度的提升。
參考資料:
https://techcrunch.com/2025/03/23/browser-use-the-tool-making-it-easier-for-ai-agents-to-navigate-websites-raises-17m/

