
你多久沒換過主力瀏覽器了?或者說,你知不知道瀏覽器其實是可以更換的?對許多人而言,瀏覽器就像電燈,每天都會開啟,卻又熟視無睹。幾十年來,從開先河的Mosaic到如今幾乎壟斷市場的Chrome,瀏覽器那張“臉”,幾乎就沒怎麼變過:位址列、書籤、重新整理按鈕——一套雷打不動的組合。我們早已習慣,甚至麻木。主流瀏覽器提供的功能,對絕大多數人來說,已經足夠好,但似乎也足夠“無聊”了。
然後,AI 來了。這個沉寂已久的領域開始發生變化。AI裹挾著終端裝置、作業系統、應用,乃至晶片的加速進化,瀏覽器也站在了變化的中心,不再甘心只是網頁的容器,而是試圖掙脫舊的軀殼,成為更多。
1
瀏覽器,正在被 AI “重新發明”
在AI這把火點燃之前,很難在瀏覽器市場掀起浪花。少數巨頭早已劃定了勢力範圍,使用者也幾乎容不得任何偏離常規的設計。即便是那些打著“生產力提升”旗號的新產品,也大多因為一點點體驗瑕疵或關鍵擴充套件的缺失,在一波嚐鮮使用者之後就被打回原形。但現在,遊戲規則似乎變了。
一批最有野心的AI創業者正帶著不同的劇本衝了進來。他們不再滿足於給瀏覽器打個 AI 補丁,在側邊欄加個聊天框。他們的目標更為根本——用AI徹底重塑瀏覽器的核心邏輯,改變我們與網際網路互動的方式。簡單來說,他們想讓瀏覽器擁有自己的“大腦”和“雙手”,替你“思考”,更能替你“行動”。
首先是The Browser Company(TBC),這家公司的名字本身就帶著明確的野心。TBC的第一款產品Arc就是融入了AI功能的瀏覽器,而他們推出的新產品 Dia 瀏覽器,則丟擲一個更具顛覆性的願景:“AI 不會僅僅是一個應用或一個按鈕……它將是一個構建在瀏覽器之上的全新環境。” TBC認為AI將構成新的計算環境的基礎,而瀏覽器將是其核心。看看他們想讓 Dia 乾的事,或許就能理解這句話的意思。
設想一下,你不再需要在不同應用和網頁間手忙腳亂地切換,只需在 Dia 的位址列用大白話下達指令——“幫我找到上週那份關於市場趨勢的報告,然後用郵件發給張三”,更進一步,“幫我把這些東西加到亞馬遜購物車”,瀏覽器也能代勞。
理想和現實之間總是有一些距離。Dia目前的早期版本,離他們第二支宣傳片中那種能替你辦事的AI似乎還有十萬八千里,有人犀利地指出它在一些產品細節上有些亮點,但“本質上就是在 Chrome 上加了一層 ChatGPT 的外衣”。
Dia瀏覽器並未採用 Arc 瀏覽器的縱向標籤欄(Arc的核心創新之一)設計,而是重新使用了使用者熟悉的橫向標籤頁模式;首頁設計極其簡潔,只保留了一個輸入框,提供 Google 搜尋和 Chat 兩個選項。

Personalization功能可以最佳化的預設Prompt,可設定你的語言偏好、表達風格,AI會智慧調整以匹配。但實際上無論你如何嘗試個性化Dia,它給人的感覺依然像是ChatGPT。

那個號稱能檢視頁面上所有內容的AI側邊欄功能,實際上任何非純文字內容,都無法讀取,反而會試圖編造答案。

創始人Josh Miller在X上引以為傲的案例是使用者可整合多個標籤頁的上下文執行復雜任務,例如根據一個標籤頁內容撰寫文件卻採用另一標籤頁的排版風格,或將開啟的標籤頁轉換為對比表格和報告。

Josh Miller稱之為極致上下文建構(tripling-down on context),這也是它試圖區別於其他 AI 產品(比如 ChatGPT、Copilot、Perplexity)的關鍵。他認為AI 在瀏覽器裡的關鍵不是模型多強,而是有沒有完整的上下文能餵給它。

從Josh Miller透露的產品規劃來看,Dia想做的是一個會成長的AI互動層,它學習你的習慣、自動適配你的任務。

如果說Dia和它背後的公司還披著一些“文藝”的外衣,那Fellou就顯得更“工科直男”一些,這兩個產品在理念上有些相似之處,而Fellou在產品實現上甚至更進一步,打出“世界首款代理式瀏覽器 (Agentic Browser)”旗號。它的核心概念是“代理式深度行動 (Agentic Deep Action)”。這話聽起來比 Dia 的“全新環境”更“技術流”一些,但核心如出一轍:讓瀏覽器更主動、更深度地介入你的工作流。
Fellou聲稱,它的AI Agent不僅能幫你處理公共領域的開放資料,還能深入你的“私有領地”(比如本地檔案或需要登入的平臺),進行復雜的研究和資訊編譯。更誘人的一點是,這些任務可以在一個“影子視窗”中悄無聲息地執行,不打擾你正在進行的“主要工作”——當然,也可能不打擾你“摸魚”。
例如,我們讓Fellou根據需求去電商上找一些商品推薦的選項,它的操作步驟和常見Agent類產品一樣,區別是會在本地的瀏覽器中執行,因此可以讓使用者登陸相應的網站賬號,從而進行跨平臺檢索,最後會輸出一份視覺化呈現的報告。

Fellou還可以自動化執行一些任務,任務自動化:能夠自動執行重複性或複雜的線上任務,比如開啟亞馬遜將商品新增到購物車、會議預訂等。我們讓Fellou開啟小紅書,給矽星人最新的一條筆記留一條評論:

Fellou成功的執行了任務,全程的操作過程如下:
影片經5倍速處理
不過從使用者的反饋整體看來,其自動化任務執行的穩定性有待提升,比如即使同樣的任務,也不能保證每次都能復現,複雜任務可能出現中斷或錯誤,由於環境是在本地,處理大量標籤頁時,可能出現卡頓或響應遲緩的情況。

Perplexity也是試圖革新瀏覽器的重磅玩家,正在推進其瀏覽器產品Comet的開發,Perplexity2025年2月宣佈正在開發Comet,5月中旬進入封閉Beta測試階段。
從有限的測試者反饋看,Comet支援從Google Chrome匯入書籤、密碼等資料。測試版中,使用者可透過“Comet助手”下達指令,實現關閉/開啟標籤頁、分組標籤頁、關閉重複標籤、檢視購物車、幫助查詢未回覆郵件等功能。

Comet會根據使用者的瀏覽歷史和開啟的標籤頁(所有資料均本地儲存,不用於模型訓練)提供個性化響應。它還將Perplexity的核心搜尋功能整合到側邊欄中,可在所有網站上訪問,使使用者無需切換標籤頁即可查詢、總結或探索內容。
此外,Comet的電子郵件邀請函中強調了諸如分析收件箱、準備面試以及生成會議記錄等使用場景——這些功能旨在“每週節省數小時”。
當然,也有使用者對Comet提出疑問,質疑其開發獨立瀏覽器的必要性,如果只是為了整合那些AI功能,其實完全可以在現有Perplexity網頁或外掛上實現,無需另做一個瀏覽器 。
整體來看,Comet的願景可總結為短期內穩步推出產品、完善AI瀏覽體驗,長期則瞄準打造“瀏覽器即作業系統”的生態。在Srinivas看來,回答問題的AI能力終將成為各家必備的基礎功能(commodity),真正的競爭優勢將來自於幫助使用者執行操作。
他明確表示,開發Comet瀏覽器是公司長遠戰略的重要一步,其最終願景是構建一個類似 Windows、Mac或Android/iOS的全能AI作業系統,“我們的計劃是開發一個作業系統,讓使用者幾乎可以在其中完成一切”。
值得注意的是,Perplexity 已公開表示將利用這些豐富的使用者資料來構建使用者畫像,並用於推出高度定製化的廣告和服務 。Srinivas 在採訪中坦言,這是他們打造瀏覽器的原因之一:“我們想獲取應用之外的所有資料來更好地理解你……例如你購買了什麼、去哪些酒店、瀏覽哪些內容,這些資訊能更全面地告訴我們你的情況” ,這引發了不少網友對隱私的顧慮。
顯然,從驚豔的概念到無縫的體驗,Dia、Fellou和Comet們還有很長的路要走,不過他們展現出的核心理念本身,就已經捅破了傳統瀏覽器功能的天花板。

1
巨頭在行動
眼看AI創業者試圖重新發明瀏覽器這個古老物種,巨頭們自然也不會坐視不理,只不過巨頭們的動作顯得更為複雜。
微軟算是其中動作最快的一個。Copilot全面植入Edge瀏覽器,目標清晰明確,將Edge打造為為每個人服務的AI伴侶。無論是幫你快速總結冗長的網頁內容,輔助你潤色措辭生硬的郵件,還是根據你的瀏覽習慣提供個性化的資訊流,Copilot都在努力讓Edge顯得更智慧、更貼心。

這是一種典型的“微軟式”打法——利用龐大的生態系統為 Edge 導流並提供整合體驗,透過AI增強現有功能,提升使用者粘性。與其說是創造一個全新的瀏覽器物種,不如說是給成熟的Edge瀏覽器裝上一個更強大的AI引擎。
相較之下,谷歌Chrome的AI化上則顯得更加謹慎。Chrome的體量實在太大了,任何激進的改動都可能牽一髮而動全身,影響數以十億計的使用者乃至其核心商業模式。因此,谷歌更多是將AI能力以一種更“潤物細無聲”的方式融入搜尋、廣告等核心業務,瀏覽器本身的AI功能迭代則相對謹慎。
然而,這並不意味著谷歌對AI瀏覽器的未來掉以輕心。一個頗具玩味的細節是,在美國司法部針對谷歌的反壟斷案中,當“剝離Chrome”作為一種可能的處罰被提出時,幾乎所有你能想到的科技巨頭——包括OpenAI——都毫不掩飾地表達了對Chrome的“濃厚興趣”。這赤裸裸地揭示了瀏覽器作為網際網路核心入口的戰略價值,在AI時代只增不減。誰掌握了瀏覽器,誰就掌握了塑造未來網際網路體驗的主導權。
而作為當前AI技術變革的頭把交椅,OpenAI的思路則更加“釜底抽薪”。儘管有傳聞稱其對收購 Chrome抱有幻想,但OpenAI的核心戰略似乎並非從頭再造一款瀏覽器,而是要透過其日益強大的基礎模型和正在研發的AI Agent產品Operator,Operator透過在OpenAI的伺服器上操作遠端瀏覽器來完成任務,它更像是Siri的未來形態,或者說是數字化“管家”。
梳理各方的路徑可見,但還需要一些突破;微軟谷歌這樣的巨頭則希望透過AI強化現有生態和使用者體驗,創業公司們在用AI的理念嘗試從根本上顛覆瀏覽器,最終瞄準的都是深層次的互動革命。

1
“下一代作業系統”的陽謀
要理解為何這些 AI 瀏覽器創業者和科技巨頭都將目光投向“作業系統”這一宏大目標,我們可以回到瀏覽器的誕生初衷。1989 年,蒂姆·伯納斯-李爵士建立全球資訊網(WWW),其核心是為了滿足科學家、高校及研究機構間便捷共享資訊的需求。瀏覽器的出現正是為了簡化這一過程,因此,它最初是圍繞“文件”設計的,將網際網路視為一個巨大的文件庫,而瀏覽器是訪問這些文件的工具。這一核心理念至今未變。
然而,隨著生成式 AI 的興起,我們開始看到網頁內容本身的“原子化”。AI 可以將資訊從固定的文字、圖片、影片等文件格式中解構出來,按需進行分析、總結、提煉,並重新組合成個性化的答案或內容。這本身就在削弱全球資訊網最初“連結文件”的設想及其構建方式。如果資訊不再以穩定的、可供連結的“文件”作為基本單元存在,而是以更碎片化、更動態的方式呈現,那麼瀏覽器——這個傳統上用來訪問文件的工具——又該如何實現它一直以來的核心功能呢?
曾在Netscape任職的Flipboard創始人兼CEO Mike McCue認為,正如瀏覽器為適應移動優先的世界而“扭曲”成了某種應用形態一樣,以個性化、互動性、對話為核心的人工智慧系統,將迫使瀏覽器再次進化。AI正在重塑我們接收和處理資訊的方式,隨之變化的必然是承載資訊的“容器”,瀏覽器本身、其底層的協議、以及我們與之互動的介面,它們都將發生演變。
有野心的創業者們都敏銳地捕捉到了這一趨勢,並試圖透過 AI 瀏覽器來引領這場變革。他們看到了傳統瀏覽器在處理日益複雜和動態的資訊、以及使用者跨應用任務需求方面的侷限性,並試圖透過 AI Agent、深度上下文理解和任務自動化來彌補這些不足,將瀏覽器從一個靜態的資訊展示工具轉變為一個動態的、智慧的個人數字助理平臺,這與作業系統的功能定位高度契合。
不過,這些新產品面對的挑戰也是巨大的。目前許多 AI 瀏覽器產品,在核心技術層面(至少在使用者可感知的層面)顯得高度同質化,很大程度上依賴於現有的基礎模型能力。Sam Altman說,大學生們傾向於將AI視為一種新型的“作業系統”。而這種“作業系統”式的使用方式,一個深度個性化、無處不在、能主動理解並協助你完成各種任務AI助手,正是OpenAI努力的方向——OpenAI也不會放過這個掌握新時代的入口的機會。
Josh Miller 也表示,“如果 Sam Altman 來模仿,我們再想應對辦法。” 這些創業者們已經意識到,自己面對的不只是Chrome這些瀏覽器,而是同樣懷揣著“下一代作業系統”野心的OpenAI這樣的巨頭們。對Dia,Fellou和Comet們來說,機會的確是巨大的,提出概念來卡住一個位置之後,接下來的競爭只會更加激烈。
