作者
|週一笑
郵箱
Agent的熱潮還在繼續。OpenAI 以“構建Agent的新工具”為標題釋出了一系列新的API平臺功能,直指下一代AI應用開發標準。
一個特別重要的變化是引入了新的Responses API。全新的Responses API,提供了Agent的構建模組,這些Agent能夠幫使用者進行搜尋、查閱檔案並在電腦上執行任務。
OpenAI此前已推出Deep Research和Operator等Agent功能。但不同的行業和應用場景千差萬別,企業和開發者需要打造不同的Agent,為此,Responses API透過提供構建模組,幫助開發者來解決這些需求。
Responses API 配備了一個網頁搜尋工具,使用的是和ChatGPT相同的搜尋模型。開發者在使用 GPT-4o和GPT-4o mini時,可以透過這個工具獲取即時的網路資訊和引用內容。
Responses API還具備Computer Use功能,可以使用OpenAI的Operator模型來能夠分析螢幕,代替使用者執行任務。此外還提供了一個文件搜尋工具,能夠快速檢索大量文件。OpenAI將其定位為幫助客服人員快速查詢常見問題解答,或者幫助律師助理檢索歷史案例。
對於開發者而言,Responses意味著只需要很少程式碼就能向AI提出更復雜的問題。比如一些原本需要一百行程式碼的工作,現在只需三行即可完成。透過 Responses API,開發者還能更清楚地瞭解模型在做什麼——它呼叫了哪些工具,為何呼叫它們,以及在呼叫前後做出了哪些決策。
該API現已面向所有開發者開放,按OpenAI的標準token和工具費率計費。

除了推出Responses API,OpenAI還發布了Agents SDK,一個能夠“編排”單個或多個AI Agent工作流程的開源工具。
Responses API是使用模型和工具來完成特定任務的基本單元,而Agents SDK讓多個這樣的基本單元協同工作,以解決更復雜的任務。
目前有超過三百萬開發者在使用OpenAI的API,被開發者廣泛使用的是Chat Completions API將類似ChatGPT的功能嵌入到自己的應用中。Responses API和Agents SDK是對OpenAI現有開發者工具的補充。Completions主要涉及文字對話,這次的Responses API可以理解為 Chat Completion API 的升級版。
Responses與基於Chat Completions構建的軟體是向後相容的。OpenAI也將繼續支援Completions API。新模型的能力不依賴於內建工具或多次模型呼叫時,Chat Completions會繼續更新,但要想使用那些便捷的工具,需要升級到Responses。OpenAI API團隊表示,未來大多數開發者會選擇Responses。
即將被淘汰的是Assistants API,這是一個在2023年OpenAI DevDay推出測試版,OpenAI還計劃在2026年年中用Responses API取代現有的Assistants API。
API需要預見開發者未來幾年可能需要的功能,不難拆解出OpenAI關於未來功能的核心側重點,新的API極大地擴充套件了開發者構建Agent的能力,為AI 工程師、AI 設計師、AI 審計員、AI 會計師鋪平道路,這些新工具不僅提供了技術便利,更體現了OpenAI的平臺戰略。

1
把開發者留在OpenAI上

大模型推理能力的提升,推動了Manus等Agent應用的興起,這些應用展示了能夠完成收集資料分析股票、自動瀏覽簡歷並進行有條理的篩選分析等任務。在這次更新的官方博文中,OpenAI也對Agent給出了兩個新的定義:我們將Agent視為能夠獨立為使用者完成任務的系統。

另外一個更加具體的定義來自SDK文件:Agent,配備指令和工具的大語言模型。這也暗示了OpenAI實現Agent的方法,Agent本質上是經過特定指令增強並能訪問工具的LLM。
在AI市場,OpenAI的Chat Completions API已成為事實上的行業標準,眾多公司為了降低開發者切換成本,紛紛提供與之相容的介面,使其成為AI應用開發的通用基準。
然而競爭並未停歇,隨著Agent的崛起,市場競爭格局正在重塑——谷歌和Anthropic等巨頭也已進軍AI Agent賽道。
Anthropic在2024年11月推出了MCP開放協議,幫助 AI Agent無縫訪問工具和資料庫,而無需為每個系統編寫程式碼。其核心目標是解決 AI 模型與資料孤島的隔離問題,透過提供統一協議替代碎片化的自定義整合。MCP使用客戶端-伺服器架構,AI 應用(如 Claude Desktop 或 IDE)透過 MCP 客戶端連線到 MCP 伺服器,前者提供資料來源或工具的訪問。

截至2025年3月,MCP已取得顯著進展:10餘款工具(包括Claude Desktop、Cursor、Continue)已整合MCP;社群貢獻超過1000個MCP伺服器,涵蓋檔案系統、GitHub、Google Drive等領域;微軟合作伙伴Block和Apollo已將MCP用於內部系統。Gartner預測到2026年,30%的企業AI專案將採用標準化協議(如MCP)整合外部資源。
MCP的獨特之處在於其專注於 AI Agent與外部系統的工具和資料來源的呼叫,而OpenAI Responses API 更側重整合化開發,直接提供封裝完善的功能模組。
對比來看,OpenAI的API是專有解決方案,MCP是開放標準。兩者都致力於增強 AI 系統的功能,但它們在實現方式和應用層次上有所不同。使用OpenAI的Agent工具開發,就好像在特定遊戲引擎中開發遊戲擴充套件包 ,功能強大但只能在該生態系統內執行;而MCP則像開放的網路協議,任何遵循這個標準的系統都能互相通訊,不論使用什麼程式語言或執行在什麼平臺上。這更像是兩家公司在同一行業趨勢下的平行發展。
OpenAI透過引入Responses API,簡化工具使用、程式碼執行和狀態管理的工作流程,憑藉這些功能,OpenAI設想Responses API成為Agent應用的基礎,消除了對多個外部整合的需求。
面對來自本土乃至中國競爭對手的競爭,OpenAI需要讓開發者持續留在自己平臺上構建應用。技術優勢不再絕對的OpenAI,似乎已將打造開發者生態系統提升為核心戰略重點。
這只是OpenAI全面構建AI Agent平臺的第一步,公司表示計劃在未來幾個月內推出更多工具和整合,以幫助開發者更有效地部署、評估和擴充套件Agent應用。
十幾年前,應用開發需要大量技術投資。隨後,蘋果和谷歌將其平民化,引爆了數百萬應用的市場爆發。如今,這一劇本正在AI領域重演——MCP和Agent SDK等技術正在大幅降低Agent應用的開發門檻,或許類似的爆發即將到來。
