OpenAI的全新Agent開發工具，想把Agent生態全抓在自己手裡

作者

｜週一笑

郵箱

｜[email protected]

Agent的熱潮還在繼續。OpenAI 以“構建Agent的新工具”為標題釋出了一系列新的API平臺功能，直指下一代AI應用開發標準。

一個特別重要的變化是引入了新的Responses API。全新的Responses API，提供了Agent的構建模組，這些Agent能夠幫使用者進行搜尋、查閱檔案並在電腦上執行任務。

OpenAI此前已推出Deep Research和Operator等Agent功能。但不同的行業和應用場景千差萬別，企業和開發者需要打造不同的Agent，為此，Responses API透過提供構建模組，幫助開發者來解決這些需求。

Responses API 配備了一個網頁搜尋工具，使用的是和ChatGPT相同的搜尋模型。開發者在使用 GPT-4o和GPT-4o mini時，可以透過這個工具獲取即時的網路資訊和引用內容。

Responses API還具備Computer Use功能，可以使用OpenAI的Operator模型來能夠分析螢幕，代替使用者執行任務。此外還提供了一個文件搜尋工具，能夠快速檢索大量文件。OpenAI將其定位為幫助客服人員快速查詢常見問題解答，或者幫助律師助理檢索歷史案例。

對於開發者而言，Responses意味著只需要很少程式碼就能向AI提出更復雜的問題。比如一些原本需要一百行程式碼的工作，現在只需三行即可完成。透過 Responses API，開發者還能更清楚地瞭解模型在做什麼——它呼叫了哪些工具，為何呼叫它們，以及在呼叫前後做出了哪些決策。

該API現已面向所有開發者開放，按OpenAI的標準token和工具費率計費。

除了推出Responses API，OpenAI還發布了Agents SDK，一個能夠“編排”單個或多個AI Agent工作流程的開源工具。

Responses API是使用模型和工具來完成特定任務的基本單元，而Agents SDK讓多個這樣的基本單元協同工作，以解決更復雜的任務。

目前有超過三百萬開發者在使用OpenAI的API，被開發者廣泛使用的是Chat Completions API將類似ChatGPT的功能嵌入到自己的應用中。Responses API和Agents SDK是對OpenAI現有開發者工具的補充。Completions主要涉及文字對話，這次的Responses API可以理解為 Chat Completion API 的升級版。

Responses與基於Chat Completions構建的軟體是向後相容的。OpenAI也將繼續支援Completions API。新模型的能力不依賴於內建工具或多次模型呼叫時，Chat Completions會繼續更新，但要想使用那些便捷的工具，需要升級到Responses。OpenAI API團隊表示，未來大多數開發者會選擇Responses。

即將被淘汰的是Assistants API，這是一個在2023年OpenAI DevDay推出測試版，OpenAI還計劃在2026年年中用Responses API取代現有的Assistants API。

API需要預見開發者未來幾年可能需要的功能，不難拆解出OpenAI關於未來功能的核心側重點，新的API極大地擴充套件了開發者構建Agent的能力，為AI 工程師、AI 設計師、AI 審計員、AI 會計師鋪平道路，這些新工具不僅提供了技術便利，更體現了OpenAI的平臺戰略。

把開發者留在OpenAI上

大模型推理能力的提升，推動了Manus等Agent應用的興起，這些應用展示了能夠完成收集資料分析股票、自動瀏覽簡歷並進行有條理的篩選分析等任務。在這次更新的官方博文中，OpenAI也對Agent給出了兩個新的定義：我們將Agent視為能夠獨立為使用者完成任務的系統。

另外一個更加具體的定義來自SDK文件：Agent，配備指令和工具的大語言模型。這也暗示了OpenAI實現Agent的方法，Agent本質上是經過特定指令增強並能訪問工具的LLM。

在AI市場，OpenAI的Chat Completions API已成為事實上的行業標準，眾多公司為了降低開發者切換成本，紛紛提供與之相容的介面，使其成為AI應用開發的通用基準。

然而競爭並未停歇，隨著Agent的崛起，市場競爭格局正在重塑——谷歌和Anthropic等巨頭也已進軍AI Agent賽道。

Anthropic在2024年11月推出了MCP開放協議，幫助 AI Agent無縫訪問工具和資料庫，而無需為每個系統編寫程式碼。其核心目標是解決 AI 模型與資料孤島的隔離問題，透過提供統一協議替代碎片化的自定義整合。MCP使用客戶端-伺服器架構，AI 應用（如 Claude Desktop 或 IDE）透過 MCP 客戶端連線到 MCP 伺服器，前者提供資料來源或工具的訪問。

截至2025年3月，MCP已取得顯著進展：10餘款工具（包括Claude Desktop、Cursor、Continue）已整合MCP；社群貢獻超過1000個MCP伺服器，涵蓋檔案系統、GitHub、Google Drive等領域；微軟合作伙伴Block和Apollo已將MCP用於內部系統。Gartner預測到2026年，30%的企業AI專案將採用標準化協議（如MCP）整合外部資源。

MCP的獨特之處在於其專注於 AI Agent與外部系統的工具和資料來源的呼叫，而OpenAI Responses API 更側重整合化開發，直接提供封裝完善的功能模組。

對比來看，OpenAI的API是專有解決方案，MCP是開放標準。兩者都致力於增強 AI 系統的功能，但它們在實現方式和應用層次上有所不同。使用OpenAI的Agent工具開發，就好像在特定遊戲引擎中開發遊戲擴充套件包，功能強大但只能在該生態系統內執行；而MCP則像開放的網路協議，任何遵循這個標準的系統都能互相通訊，不論使用什麼程式語言或執行在什麼平臺上。這更像是兩家公司在同一行業趨勢下的平行發展。

OpenAI透過引入Responses API，簡化工具使用、程式碼執行和狀態管理的工作流程，憑藉這些功能，OpenAI設想Responses API成為Agent應用的基礎，消除了對多個外部整合的需求。

面對來自本土乃至中國競爭對手的競爭，OpenAI需要讓開發者持續留在自己平臺上構建應用。技術優勢不再絕對的OpenAI，似乎已將打造開發者生態系統提升為核心戰略重點。

這只是OpenAI全面構建AI Agent平臺的第一步，公司表示計劃在未來幾個月內推出更多工具和整合，以幫助開發者更有效地部署、評估和擴充套件Agent應用。

十幾年前，應用開發需要大量技術投資。隨後，蘋果和谷歌將其平民化，引爆了數百萬應用的市場爆發。如今，這一劇本正在AI領域重演——MCP和Agent SDK等技術正在大幅降低Agent應用的開發門檻，或許類似的爆發即將到來。