Exa:給AIAgent的“BingAPI”

作者:yongxin
編輯:Siqi
Agentic AI 的 3 要素是:tool use,memory 和 context,圍繞這三個場景會出現 agent-native Infra 的機會。
Agent 所獲取到的資訊質量是 agent 推理的起點,雖然 LLM 帶來了 perplexity 為代表的 AI answer engine,提供了完全不同於傳統搜尋引擎的體驗,但這些產品仍舊面向的是人類使用者,產品邏輯是圍繞人類行為設計的。

在我們 MCP 的研究中發現, GitHub MCP Servers 列表裡使用場景最多的是搜尋和資料檢索,開發者們的偏好也反映出 agent-native 搜尋的重要性。

Exa 要做的是 LLM 時代的 “Bing API”,為 AI agent 系統重新設計搜尋,當 AI-native 應用或者 AI Agent 需要實現網際網路資訊搜尋時,都可以呼叫 Exa 的 API 能力因此,Exa 的核心受眾是B 端企業和開發者。在功能上,Exa 可以實現更復雜的語義搜尋。比較有意思的是團隊的技術願景,公司認為,Exa 的架構讓使用者可以選擇投入更多的計算資源、等待更長的時間,來獲得更多、更完善的搜尋結果。
💡 目錄 💡
           01 為什麼 Search API 很重要    
           02 Why now
           03 什麼是 Exa?
           04 Exa API 的使用場景
           05 技術
           06 團隊
           07 Exa 的價值
           08 Exa 面對的挑戰和競爭
           09 融資和經營
01.
為什麼
Search API 很重要
按照場景和資訊需求型別,搜尋行為大致可以被分為四類:
• 第一類,高頻快速查詢,指的是一兩步內就能完成的查詢。Google 大部分的 query 還是以幾個單詞為主,使用者得到答案後馬上離開,不會進行深入的查詢。對於這類查詢 Google、Bing 還是最好的應用,新玩家幾乎沒有挑戰的機會。
• 第二類,研究性質的深入查詢,使用者可以和搜尋工具反覆交流,獲取知識。這一類搜尋是 LLM 和 LRM 帶來的新場景,對應的代表性產品形態分別是 Chatbot 和 Deep research。
• 第三類是個人偏好查詢,搜尋引擎需要根據使用者的個性化資訊和偏好才能給使用者合適的推薦。大模型讓新玩家有機會挑戰傳統玩家,核心原因是傳統搜尋只能支援簡單查詢,而大模型可以處理語義更復雜的查詢,提供更精準、個性化的答案。但有幾個落地難點,比如:大模型缺乏長記憶能力;個人偏好查詢往往是快速查詢,對響應速度要求較高;使用者資料在雲端處理還是本地處理等等。代表性產品有 AI 電商搜尋領域的 Daydream、Constructor 等。
• 第四類是長尾查詢。使用者有不同的感興趣的小眾領域。
AI 在第二、第三類場景最具成為挑戰者的潛力。未來,這些搜尋場景極有可能是人與 AI agent 進行互動,agent 在理解意圖後用 tool use 的方式進行蒐集、驗證、任務執行,我們已經在一系列 Deep Research 產品上看到雛形。因此,Agent 未來會替代人類成為網頁資訊搜尋的主力“使用者”。在 2 年前,OpenAI 前安全研究副總裁 Lilian Weng 就提出 search 是 agent tool use 中的重要部分,站在今天看,Agentic AI 的實現基礎有 context、tool-use 和 memory,RL 環境給 tool-use 提供了 infra,search API 也是對 context 能力提升的工具。
過去的搜尋市場是對人類使用者的競爭,未來的搜尋將在為 agent 提供搜尋的能力上展開競爭,這也是我們關注 Exa 的原因。目前是搜尋引擎是圍繞人用軟體的邏輯去設計的,我們認為 AI agent 需要一套和人類不同的 search infra,原因有幾個方面:
• AI 需要更復雜的查詢。現有搜尋引擎主要服務快速查詢——使用者 query 通常只是幾個單詞或短語,無法搜尋含有多個複雜查詢條件的 query。
• AI agent 需要正確且豐富的 context 才能發揮作用。然而傳統快速查詢的需求決定了使用者只關心搜尋結果的第一頁,極少翻閱後續頁面。這導致靠後的搜尋結果大多是使用者幾乎不會開啟的“垃圾內容”。但 AI agent 不僅只需要前幾頁。
• AI 需要高吞吐低延時做得更極致的搜尋系統,人類一天搜尋的次數可能比不上 AI 一分鐘需要搜尋的次數。
• 現有的搜尋工具塑造了人們建立的內容,網站迎合的是搜尋引擎而不是尋求內容的使用者。大部分網站都根據 Google 的 ranking 演算法進行了 SEO 和逆向工程,這樣的搜尋引擎搜出來的可能是關鍵字匹配的低質量內容,但 AI 的推理系統需要的是真正相關的知識。
基於以上原因,AI 需要新的 search infra。Perplexity 早期用的也是現成的搜尋 API(如 Bing API),後來也開始自建嵌入模型,側面說明傳統的搜尋無法滿足 AI 產品的需求。
02.
Why now
LRM 帶來的第一個落地的 Agent 是 deep research。Deep research 是一個非常典型的 agentic RAG 架構,透過 dynamic planning、long horizon reasoning 以及 decision making 在複雜任務中實現檢索-加工-驗證-最佳化,檢索的質量是 agent 推理的起點。
目前開發者對 MCP 的共識提高,我們統計 MCP 在 GitHub 提供的 154 個 MCP Servers 列表裡,使用場景最多的是搜尋和資料檢索,大約有 34 個,主要用於實現網路搜尋、爬取內容、語義檢索、向量搜尋等功能。MCP 不僅推動了 AI-native 的 search infra 標準化連線大模型時機的成熟,社群貢獻的結果也反映了 search 對於 agent 的重要性。
2025 的關鍵詞是 Agentic AI,在這個時間點關注 Agent Infra 是一個好的時間點,而資訊檢索是最高頻的場景之一。
03.
什麼是 Exa?
Exa 是 LLM 時代的 “Bing API”,為 AI 重新設計搜尋系統,處理 AI 時代複雜的檢索請求,為後續 AI 的推理和執行提供更好的知識。
Exa 把網際網路的內容分類構建了自己的 embedding,核心目的是搜尋最精確的內容、找到最相關的網站。Exa 的技術衍生出來的產品形態主要有兩個:一個是 API, 為 B 端開發者提供的搜尋 infra。另一個是 web 端產品 Websets,更加 to prosumer。 Websets 相當於把網際網路變成一個可以用多種條件過濾的 Excel,使用者用語義搜尋就可以直接獲得一個最需要的資訊列表,未來也會以 API 的形式提供。Exa 的搜尋技術適合用於構建 agentic RAG、構建研究 agent 等。
API
Exa 的主要收入來自 API,圍繞不同場景,Exa 開發出了一系列 API 支援不同的功能。最核心的是 Search API, 用於語義搜尋:使用者輸入自然語言,Exa 把自研的嵌入模型與傳統的關鍵字搜尋配合起來使用,實現尋找最相關的內容。輸出的格式可以自由定製,例如選擇標題、生成 highlight、正文、生成摘要、subpages、相關性得分等。
其它 API 還有:
 Get Contents API :可以理解為一個爬蟲 API ,使用者輸入一串 url,即可爬取多個網頁內的各種內容。
 Answer API :可以對搜尋的結果進行智慧問答。
 Find Similar Links API :可以返回與使用者輸入的 url 內容相似的網站。
API 主要的使用物件是 B 端或者開發者,這些人在構建 AI-native 應用的過程中會利用到 Exa 的這些 API,為了匹配這些場景需求, Exa 在速度、scale 和即時性上都做了專門的最佳化:
1)速度方面 latency 在 300ms,每秒可以輸入 100+ queries。作為對比, Google 的 latency 普遍被認為大概在幾十至幾百毫秒。
2)規模方面,每次可以支援返回數千個結果。
3)即時性方面,每兩分鐘更新 index 庫,持續新增新的連結。
4)infra 方面 Exa 在 LangChain,LlamaIndex,CrewAI,OpenAI 等都做了 integration 上的最佳化。
search 功能 API 使用示例
search 功能的視覺化示例
不過,Exa search API 價格比傳統解決方案要高很多,Exa search API 提供 100 個結果需要 $25。相比之下 Bing Search API 每 1000 次呼叫價格在 $10~25。因此 Exa API 的價格大概是 Bing 的 10x。
Websets
Websets 是搜尋能力衍生出來的產品,使用者用語義搜尋就可以直接獲得一個完整的資訊列表,Websets 在 Web 端基本形態如下圖。公司透露 Websets 的能力未來也會以 API 的形式提供。
Websets 的產品形態。這裡的 query 是:
help me find AI search engine startup in the USA with over $5M funding.
從功能和形態來看, Websets 都很像通用版的 Clay
Clay 主要做銷售線索的 data enrichment,B 端使用者可以 Clay 的資料庫中篩選出一個 company list 或 people list,然後 Clay 用 waterfall 式的搜尋辦法從資料合作商中搜索對應的銷售線索,例如郵件、電話,和地址。Clay 最新的估值是 12.5 億美金,ARR 約 3700 萬美金。
但 Websets 能力範圍大於 Clay:
1)使用者可以搜尋任意的 categories,除了 sales 領域,常用的場景還有投資研究、學術搜尋,以及招聘等。
2)使用者可以用自然語言新增任何篩選方式,Websets 從整個網際網路搜尋。而不是像 Clay 只有固定的篩選方式,其主要從合作商資料庫搜尋。
3)使用者可以新增任意希望填充的指標;而 Clay 只能用既定的指標。
相比於 Clay 做的是 domain-specific 的資料,作為開放版本的 Clay——Websets 最容易受到質疑的就是準確性。而準確性是 Websets 的核心賣點。Exa 從 0 開始對網際網路做了一套 embedding vector(儘管不是整個網際網路),因此 Websets 的搜尋結果能給出非常準確的 reference。
另外,在產品層面,每次用 Websets 進行探索性搜尋的時候,使用者可以選擇先生成幾行進行 preview。這樣一來,Websets 在投入更多計算資源之前能夠確認這是使用者需要的 dataset。
在 Exa 的內部基準測試中,Websets 比 Google 和 OpenAI Deep research 能找到多 10 倍的正確結果。
Google vs OpenAI's Deep Research vs Websets (low compute) vs Websets (high compute) in Exa's benchmark of complex queries.
SimpleQA 是 OpenAI 釋出的一個基準測試,
可衡量LLM回答簡短問題的能力。
Websets Pro 定價為 $800/月,是目前 OpenAI Deep research 的 4x。 處理速度上 Exa 每秒 100+ query,Bing 的 TPS 在 100~250 左右,Exa 目前沒有領先。
Search API pricing
Bing Search API pricing(部分)
04.
Exa API 的使用場景
Exa 的主要收入來自 API,API 的使用物件主要是構建 AI-native application 的使用者;或者是搜尋強度大的行業,例如銷售、投資研究。有 VC 客戶透露他們每天幾乎連續使用  Exa 8 小時以上,用於各種不同型別的查詢。Exa 的 API 為客戶做了非常多強大的 agents。
因此 Exa 也為這些場景做了 demo 來展示。這些 demo 底層的核心還是 Exa API 的三個關鍵能力:1)語義理解;2)自研的搜尋系統搜尋最相關的內容;3)較低的 latency。
• Company research agent
Exa 有很多使用者是投資公司,他們使用 Exa 來輔助投研。分析師在研究初創公司時,第一步一定是相對標準化的資訊蒐集:整理融資記錄、團隊背景、公司新聞和關鍵里程碑、並透過 YouTube、X 等社交媒體搜尋創始人言論和社群對產品的討論,如果是技術類產品,則還需要去 GitHub 和 Google Scholar 查技術更新。
雖然內容並不複雜,但這些資訊分散在不同的網站、平臺上,因此是一個很耗時的工作,Exa 提供的這個 demo 相當於一個預定義的 agent,提高了分析師在資訊蒐集環節的效率。
 超級寫作補全 agent
和 coding agent 相比,LLM 時代仍缺乏實用性強的寫作 agent。寫作比 coding 更開放,agent 難以 100% 預測、理解使用者的寫作意圖,因為實用性受限。Exa 這個寫作 agent 的 PMF 差異化在於以搜尋為核心,在理解句子後自動補全並附上參考,節省作者的搜尋時間。
 Twitter Wrapped
幾乎每個 to C 的 App 都開始流行“年度使用報告”,基於內部資料為使用者提供年度總結。Exa 的這個 demo 可以從外部用 search agent 的方式對 twitter 做分析和總結,類似的 agent 可以遷移到不同的平臺和應用,其價值在於跨平臺的搜尋分析能力。
 學術論文 search agent
這個 Agent 是 Exa 的 CEO 用不到兩天的時間內,對 4500 份論文做的一個 search agent,可以以視覺化的方式展示 Exa 是如何對論文進行 index、分類,以及相似性搜尋。
除了官方釋出的一些 demo 之外,Exa 在 twitter 上的熱度很高,經常有使用者分享他們如何用 Exa 的 API 構建有趣的 demo,例如 YouTube search agent, twitter search agent,電商購物 search agent。
有趣的是,Exa 還用自己的產品為自己找客戶,比如在 Websets 上搜索”曾經發布關於探索性搜尋文章的公司“。因為關注這個領域的公司就是他們的潛在客戶。
05.
技術
作為一個初創公司 Exa 沒有足夠的資源對整個網際網路構建索引,所以團隊戰略性地先選擇對網際網路的部分內容索引,以此作為搜尋系統的基礎。基本的工作流程是:選擇文件進行爬取、解析,儲存在雲伺服器上;然後需要對文件構建嵌入,構建向量資料庫,作為後續搜尋的基礎。
系統的基本流程
這樣的戰略其有效性在於:實際上使用者大部分的查詢都是常見的查詢,一個小型的知識系統是可以回應大部分問題的,這類似於“二八效應“。剩下的內容可以用更簡單的方式解決,比如利用現有的 API 快速查詢。
不過這也帶來實操上的難點:例如如何選擇”優質“的網頁構建索引?在這方面 Exa 團隊先定義了一系列重點關注的類別,例如學術、新聞、人物等等,然後再逐漸迭代。
部分 Exa Index 的類別
在模型方面,Exa 基於端到端的神經網路和 transformer 來查詢索引,這樣做尤其勝任模糊語義和多層語義的查詢。模型的工作原理是:當用戶輸入 URL,Exa 會爬取並解析其主要內容,模型根據文字風格、域名及核心觀點等因素,預測相似討論的網頁。
用 Transformer 直接做搜尋系統輸出連結則需要記住整個網際網路非常困難。所以 Exa 在 transformer 的基礎上改進模型並不斷迭代架構,把 next token prediction 變成了 next link prediction 和 next document prediction,讓搜尋系統實現預測最相關的網頁。
CEO 認為,基於 transformer 的架構為 Exa 的搜尋系統帶來了另外一個差異價值:投入的計算資源越多,查詢結果可以不斷變得更全面、更精準。Exa 官方也給出了一個實驗證明:當其讓模型花更多的 test time compute 進行搜尋,模型就能得到更多的匹配結果。Websets 的能力正是建立在這樣的模型之上:一份包含上千個結果的 Websets 列表可能需要一個小時來響應,但這樣使用者能夠得到一份完美的結果。
With Websets, Exa discovered a new scaling law, but for search. The more compute your search uses, the more comprehensive the results.
因此,公司自始就重視計算資源,比如種子輪融的 500 萬美金花了一半買計算資源,公司部署的 AftaCluster 是該行業最早基於 NVIDIA 的 H200 GPU 的 AI 和 HPC 的叢集之一。
06.
團隊
Exa 團隊是在 ChatGPT 釋出就一年前建立的,聯合創始人 Will Bryk 和 Jeff Wang 是 Harvard 的室友。
Will Bryk 在 Harvard 學習 CS 和物理,曾在 SpaceX 工作,並在 Cresta 有兩年的工作經驗。
Jeff Wang在 Harvard 學習 CS 和哲學,畢業後在 Plaid 擔任了兩年的工程師。
Exa 的搜尋系統是從頭構建了爬蟲系統、嵌入模型、向量資料庫、AI 處理系統,以高吞吐量、低延遲的方式提供服務。這裡每個技術部分 Google 都有上百數千人的團隊,而對應 Exa 每個部分只有 1~2 人。Exa 目前核心技術團隊不到 20 人,來自清華姚班、Palantir,Apple,Adobe、量化交易等等,人數雖少但每一個都有獨當一面的能力。
07.
Exa 的價值
未來 LLM 會成為所有 agent 的底層,LLM 需要搭配不同的工具才能成為完善的 AI agent。例如 LLM 啟用 Figma 可以用於設計,LLM 啟用 Exa 則可以完成搜尋。由於把 LLM 連線到即時網際網路基本已經成為 agent 的剛需,所以 Search API 是 LLM 必備的工具。
Exa 的技術相比於現有的 search API 有兩個差異點:
1)傳統的搜尋 API 主要用於快速搜尋,難以滿足複雜的查詢,Exa 可以實現更復雜的語義搜尋。
2) Exa 的架構讓使用者可以選擇投入更多的計算資源、等待更長的時間,來獲得更多、更完善的搜尋結果。這個技術點在 Websets 中很好地展示了產品層面的差異化、獨特性,並且符合很多工作場景的需求,比如:銷售人員 mapping 潛在客戶;分析師 mapping 投資標的、競品;求職者 mapping 工作機會、學者 mapping 領域內的論文等等。人們做類似的 mapping 原本都需要花費大量的搜尋時間,現在都可以把它交給 Websets。
Exa 的 Websets 本身也是一個定義得很好的 agent 形態,RL 最擅長在 verifiable environment 中不斷增強能力解決一個端到端的問題,Websets 根據使用者的 criteria 構建出一個表格是很容易 verify 搜尋結果是否符合使用者定義的標準的。
08.
Exa 面對的挑戰和競爭
作為面向 Agent 的 search engine,Exa 常常被拿來和 Google、LLM,Deep research 進行對比。
首先,Exa 不會顛覆 Google,它做的是 Google search 做不了的事情。
舉個最直觀的例子,如果在 Google 搜尋 “AI start ups with VC funding based in California” ,根據關鍵字匹配的邏輯,返回的結果通常是某個博主寫的“Top 10 AI companies  in California”之類的部落格。相比之下,Exa 可以根據相關性的邏輯返回一個個具體的公司。
Exa 的回答
Bing 的回答
Google 的回答(Google 的廣告是最多的)
另外對比現在的搜尋市場。Google 收入上限通常受限於廣告變現能力,例如 Google 每千次瀏覽可能賺 1 美分左右,因此每頁瀏覽的語言模型推理成本必須遠低於此收入才能盈利。目前 LLM 的競爭讓其成本急速下降,這也為重新設計 AI-native 的搜尋演算法打開了可能的視窗。
Exa 不和 LLM 競爭,而更像 LLM 的補充工具。作為 agent infra, Exa
定位是在 LLM 的能力之上構建即時的、最相關的 search engine,將 LLM 的智慧與網際網路的知識連結起來。
從 deep research 的角度看競爭, deep research 能不能實現 Websets 的能力?我們認為 Exa 的 Websets 是比 deep search 定義更清晰的 agent。這裡用一個測試例子來說明 Exa 和 deep search 的差異點。我們給出的 prompt:“act as a recruiter, help a AI-native startup look for 10 software engineers with Rust programming experience who are currently in San Francisco”,以下分別是 Exa、Grok3 deep research 和 ChatGPT deep search 的輸出結果:
這三個產品中,只有 Exa 輸出了一系列符合要求的聯絡人:
Grok 3 deep search 的輸出的是 HR 應該以什麼步驟、什麼渠道釋出 job description:
ChatGPT  deep search 輸出的是 10 份招聘資訊:
Deep research 專注搜尋+推理研究,Exa Websets 更專注搜尋。論智慧、論速度、論研究能力,Exa 其實都不是 ChatGPT 和 Grok 3 deep research 產品的對手。Exa 的差異位在於利用 built from ground up 的 index、vector,用自研的模型提供最相關的搜尋。因此 Exa 更有可能成為 Deep research 產品底層的資訊 infra。
在“AI搜尋”的語境中,Exa 的競爭對手並不是 perplexity 等 AI 搜尋產品,而是其他圍繞 context 場景提供價值的 Agent Infra,其中的典型代表是 Brave Software。Brave Software 的產品包括瀏覽器 Brave Browser、搜尋產品 Brave Search,外掛助手 Leo AI 等。
Brave 成立於 2015 年,CEO Brendan Eich  是 JavaScript 的創造者,曾是 Mozilla 的聯合創始人。
2025 年 2 月推出的 Mistral 的聊天機器人平臺 Le Chat 就使用的是 Brave 的搜尋 API 獲取即時網頁結果。3 月下旬 Claude 推出了網頁搜尋功能,目前不清楚由哪個搜尋引擎提供支援,但根據 TechCrunch 資訊,Claude 有可能在使用 Brave Search 作為搜尋引擎。
09.
融資和經營
融資方面,Exa 2021 年成立,2021 年 8 月份是在 YC accelerator 拿了 13 萬美金;隨後 9 月份融了 500 萬的種子輪,投資者有 Lombardstreet Ventures, TSVC, Pioneer Fund,Helium-3 Ventures,Atypical Ventures, Pi Campus, Soma CAPItal 和 SLVC。2024 年 7 月,公司進行了 2200 萬美金的 A 輪融資,由 Lightspeed 領投,英偉達, YC,WndrCo 和 Haystack 跟投。估值方面並未透露。
經營方面,Exa 主要透過 API 創收,將其出售給擁有 AI 應用的企業或需要內部構建 agent 的公司,例如金融、銷售行業,用例涵蓋了非常廣泛的領域。公司在 2024 年 7 月 A 輪融資時透露:目前使用者數量在數千家,收入在過去幾個月內增長了 3 倍。如果我們按 1000* 800/月*12月來估算,ARR 至少 960 萬美金,但考慮企業的合同都是高度定製化的,所以實際收入應該更多。
排版:Doro
延伸閱讀

Cartesia: 3 個月融資 9100 萬美元,從 Transformer 到 Mamba 重塑語音 AI

大模型非共識下,什麼是 AGI 的主線與主峰?

Physical Intelligence 創始人:人形機器人被高估了

詳解 MCP:Agentic AI 中間層最優解,AI 應用的標準化革命

Flagship 創始人:AI for Science 的下一步是 Multi-Agent

相關文章