42.5Exaflops:谷歌新TPU效能超越最強超算24倍,智慧體協作協議A2A出爐

機器之心報道
編輯:澤南、+0
第七代 TPU 來了。
AI 算力又迎來了新的標杆。
本週三,谷歌正式釋出了旗下第七代張量處理單元(TPU)Ironwood。谷歌稱,在大規模部署的情況下,這款 AI 加速器的計算能力能達到全球最快超級計算機的 24 倍以上。
這款在 Google Cloud Next '25 大會上釋出的新晶片代表著谷歌十年來 AI 晶片研發戰略的重大轉折:谷歌自研的前幾代 TPU 主要面向 AI 的訓練和推理工作負載,而 Ironwood 是第一款專為推理而設計的晶片。

谷歌副總裁兼機器學習、系統和雲 AI 總經理 Amin Vahdat 表示:「Ironwood 旨在支援生成式 AI 的下一階段及其巨大的計算和通訊需求。這就是我們所說的『推理時代』,AI 代理將主動檢索和生成資料,以協作方式提供洞察和答案,而不僅僅是資料。」
突破壁壘,最大 42.5 exaflops 算力
Ironwood 擁有超模的技術規格,當每個 pod 擴充套件至 9216 塊晶片時,它可提供 42.5 exaflops 的 AI 算力,遠超目前全球最快的超級計算機 El Capitan 的 1.7 exaflops。每塊 Ironwood 晶片的峰值計算能力可達 4614 TFLOPs。
在單晶片規格上,Ironwood 顯著提升了記憶體和頻寬,每塊晶片配備 192GB 高頻寬記憶體(HBM),是去年釋出的上一代 TPU Trillium 的六倍。每塊晶片的記憶體頻寬達到 7.2 terabits/s,是 Trillium 的 4.5 倍。

在資料中心規模擴大,供電逐漸成為瓶頸的時代,Ironwood 也大幅提升了計算效率,其每瓦效能是 Trillium 的兩倍,和 2018 年推出的首款 TPU 相比高出近 30 倍。
對於推理的最佳化代表了 AI 發展歷程中的一個重要轉折點。最近幾年,前沿的 AI 實驗室一直專注在構建引數規模不斷擴大的基礎模型上。谷歌轉向推理最佳化表明,我們正在進入一個以部署效率和推理能力為核心的新階段。
畢竟對於 AI 參與的業務而言,模型訓練的次數有限,但隨著 AI 技術應用逐漸鋪開,推理操作每天都會發生數十億次。由於模型日趨複雜,這些業務的經濟效益與推理成本緊密相關。
谷歌在過去八年裡對於 AI 計算的需求同比增長了 10 倍,總需求量高達驚人的 1 億。如果沒有像 Ironwood 這樣的專用架構,任何摩爾定律的進步都無法滿足這一增長曲線。
尤其值得注意的是,谷歌在釋出中提到了對執行復雜推理任務而非簡單模式識別的「思維模型」的關注。這表明,谷歌認為 AI 的未來不僅在於更大的模型,還在於能夠分解問題、進行多步驟推理並模擬類人思維過程的模型。
面向下一代大模型
谷歌將 Ironwood 定位為其最先進 AI 模型的基礎設施,其最佳化的大模型自然包括自家的 Gemini 2.5,它「原生內建了思維能力」。
昨天,谷歌還發布了 Gemini 2.5 Flash,作為最新旗艦模型的縮小版本,它「可以根據提示的複雜性調整推理深度」,定位於對響應速度敏感的日常應用。
谷歌還展示了其全套多模態生成模型,包括文字轉影像、文字轉影片以及新發布的文字轉音樂功能 Lyria。谷歌展示 demo 介紹瞭如何將這些工具結合使用,為一場音樂會製作完整的宣傳影片。
Ironwood 只是谷歌更廣泛的 AI 基礎設施戰略的一部分,谷歌還宣佈推出 Cloud WAN,這是一項託管式廣域網服務,使企業能夠訪問 Google 的全球規模私有網路基礎設施。
Google 還在擴充套件其面向 AI 工作負載的軟體產品,其中包括由 Google DeepMind 開發的機器學習執行時 Pathways,現在它允許客戶在數百個 TPU 上擴充套件模型服務。
提出 A2A、支援 MCP,構建智慧體協作生態
除了硬體之外,谷歌還概述了以多智慧體系統為中心的 AI 願景,釋出了一個促進智慧體發展的協議 ——Agent-to-Agent(A2A),旨在促進不同 AI 智慧體之間的安全、標準化通訊。
地址:https://google.github.io/A2A/#/
谷歌認為,2025 年將是 AI 方向轉型之年,生成式 AI 的應用形式會從回答單一問題轉向透過智慧體系統來解決複雜問題。

A2A 協議允許跨平臺、跨框架的智慧體實現互操作,為它們提供了共同的「語言」和安全的通訊渠道。這一協議可視為智慧體的網路層,其目標是簡化複雜工作流程中的智慧體協作,使專業 AI 智慧體能夠協同完成各種複雜度和時長的任務,從而透過協作提升整體能力。

A2A 的工作原理
谷歌在部落格中對 MCP 和 A2A 兩種協議進行了比較。
MCP(模型上下文協議,Model Context Protocol)用於工具和資源管理
  • 透過結構化的輸入 / 輸出將智慧體連線到工具、API 介面和資源
  • Google ADK 支援 MCP 工具,使得各類 MCP 伺服器能夠與智慧體配合使用
A2A(智慧體間協議,Agent2Agent Protocol)用於智慧體之間的協作
  • 在不共享記憶體、資源和工具的情況下,實現智慧體之間的動態多模態通訊
  • 由社群驅動的開放標準
  • 可使用 Google ADK、LangGraph、Crew.AI 等工具檢視示例
總的來說,A2A 與 MCP 是互補的:MCP 可以為智慧體提供工具支援,而 A2A 則讓這些裝備了工具的智慧體能夠相互對話和協作。
從谷歌公佈的合作伙伴陣容來看,A2A 似乎有望獲得類似 MCP 的關注度。該計劃已吸引超過 50 家企業加入首批合作陣營,包括領先科技企業以及全球頂級諮詢和系統整合服務商。

谷歌強調了該協議的開放性,將其作為智慧體相互協作的標準方式,不受底層技術框架或服務供應商的限制。谷歌表示,在與合作伙伴設計協議時,堅持了以下五項關鍵原則:
1. 擁抱智慧體能力:A2A 專注於使智慧體能夠以其自然、非結構化的方式進行協作,即使它們不共享記憶、工具和上下文。我們正在實現真正的多智慧體場景,而不將智慧體限制為「工具」。
2. 基於現有標準構建:該協議建立在現有流行標準之上,包括 HTTP、SSE、JSON-RPC,這意味著它更容易與企業日常使用的現有 IT 堆疊整合。
3. 預設安全:A2A 設計為支援企業級身份驗證和授權,在釋出時與 OpenAPI 的身份驗證方案相當。
4. 支援長時間執行的任務:我們設計 A2A 具有靈活性,支援各種場景,從快速任務到可能需要數小時甚至數天(當人類參與其中時)的深入研究。在整個過程中,A2A 可以向用戶提供即時反饋、通知和狀態更新。
5. 模態無關:智慧體世界不僅限於文字,這就是為什麼我們設計 A2A 支援各種模態,包括音訊和影片流。
官方還給出了一個例子,透過 A2A 招聘流程得到顯著簡化。
在 Agentspace 等統一介面中,招聘經理可指派智慧體依據職位需求尋找匹配人選,該智慧體會與專業領域智慧體互動完成候選人尋源工作。使用者還可指示智慧體安排面試,並啟用其他專項智慧體協助背景調查,從而實現跨系統協作的全流程智慧化招聘。
與此同時,谷歌也在擁抱 MCP。就在 OpenAI 宣佈採用競爭對手 Anthropic 的模型上下文協議(Model Context Protocol,簡稱 MCP)幾周後,Google 也緊隨其後加入了這一行列。
剛剛,Google DeepMind 執行長 Demis Hassabis 在 X 平臺上發文宣佈,Google 將在其 Gemini 模型和 SDK 中新增對 MCP 的支援。不過他並未給出具體時間表。
Hassabis 表示:「MCP 是一個優秀的協議,正在迅速成為 AI 智慧體時代的開放標準。期待與 MCP 團隊和業界其他夥伴一起推進這項技術的發展。」

自 2024 年 11 月釋出以來,MCP 迅速走紅,引發廣泛關注,成為連線語言模型與工具和資料的一種簡單、標準化方式。

MCP 使 AI 模型能夠從企業工具和軟體等資料來源獲取資料以完成任務,並訪問內容庫和應用程式開發環境。該協議允許開發者在資料來源與 AI 驅動的應用程式(如聊天機器人)之間建立雙向連線。
開發者可以透過 MCP 伺服器開放資料介面,並構建 MCP 客戶端(如應用程式和工作流)來連線這些伺服器。自從 Anthropic 開源 MCP 以來,多個公司已在其平臺中集成了 MCP 支援。
參考內容:
https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/
https://venturebeat.com/ai/googles-new-ironwood-chip-is-24x-more-powerful-than-the-worlds-fastest-supercomputer/
https://arstechnica.com/gadgets/2025/04/google-unveils-ironwood-its-most-powerful-ai-processor-yet/
https://virtualizationreview.com/articles/2025/04/09/protocols-for-agentic-ai-googles-new-a2a-joins-viral-mcp.aspx
https://developers.googleblog.com/zh-hans/a2a-a-new-era-of-agent-interoperability/
https://google.github.io/A2A/#/

© THE END 
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]


相關文章