TPU效能提升10倍，開源A2A顛覆智慧體互動| Google CloudNext25劃重點

作者 | 高玉嫻

Google Cloud Next 25 重要釋出概覽：釋出第七代 TPU Ironwood，提供更強的計算能力；儲存、網路和計算方面的創新，有助於最佳化 AI 部署；Google 分散式雲的最佳化，企業可以將 Gemini 模型部署到本地；Vertex AI 的創新，例如 Agent Development Kit 和 Agent2Agent 協議，可實現多智慧體生態協同；Agentspace 的增強功能，使每個員工都能從 AI 中受益等。

美國時間 4 月 9 日，Google Cloud Next 25 在拉斯維加斯開幕。不出所料，今年的主角仍是 AI。但與以往不同的是，其釋出亮點更多從技術突破轉向了價值交付，從單點創新轉向了規模化應用。

Google Cloud CEO Thomas Kurian 在開幕演講中表示，過去一年中，Google Cloud 和 Workspace 上已經推出了 3000 多項改進和更新，超過 400 萬開發者使用 Gemini，這使得 Vertex AI 使用者規模增長了 20 倍。他指出，這得益於 Gemini、Imagen（影像生成模型）和 Veo（影片生成模型）的快速普及，在企業需求推動下，Google Workspace 內部每月為企業使用者處理的 AI 請求量已經超過 20 億次，可以說從根本上重塑了工作方式。

AI 超級計算架構不斷完善和升級

這一系列生產力的革新首先源於谷歌在基礎設施層面的全面“AI 化”。

今年大會開幕演講的主題是“The New Way to Cloud”, 在筆者看來，其中所謂的“New Way”即是面向 AI 的，能夠滿足 AI 開發和應用需求的新方式。

Google 與 Alphabet CEO Sundar Pichai 強調，AI 的未來機會和潛力巨大，這也是 Alphabet 近幾年來持續大手筆投資 AI 基礎設施的重要原因。據他透露，2025 年穀歌將投入約 750 億美元用於伺服器和資料中心建設。

與此同時，為了進一步幫助客戶擁抱 AI， Google Cloud 還宣佈將以“谷歌速度”（接近零延遲）為全球數十億使用者提供雲廣域網（Cloud WAN），與其他託管和開源 Kubernetes 產品相比，這意味著，Cloud WAN 能幫助 Google Cloud 客戶將網路效能提升 40%，同時將總擁有成本（TOC）降低 40%。

晶片作為每年的關注焦點，今年穀歌推出了迄今為止規模最大、效能最強的第七代 TPU——TPU Ironwood。

據 Google Cloud 機器學習、系統和雲人工智慧副總裁 Amin Vahdat 介紹，TPU Ironwood 效能較前代高效能 TPU（v5p）提升了 10 倍以上，每個 Ironwood 單元搭載超過 9,000 顆晶片，每個單元可提供 42.5 exaflops 計算能力，是當今世界上最快的超級計算機 El Capitan 每個艙體效能的 24 倍，可以很好地滿足 Gemini 2.5 等 AI 模型日益增長的計算需求。

自去年與英偉達強強聯手以來，谷歌提供了非常廣泛的基於英偉達 GPU 的產品，這意味著使用者可以使用英偉達的最新硬體在 Google Cloud 上訓練生成式 AI 模型。今年，谷歌進一步推出了搭載英偉達 B200 和 GB200 Blackwell GPU 的 A4 和 A4X 虛擬機器，顯著增強了 GPU 產品組合。據透露，Google Cloud 還將成為首批提供英偉達下一代 Vera Rubin GPU 的公司之一，該 GPU 每個機架可提供高達 15 exaflops 的 FP4 推理效能。

除了晶片之外，在谷歌看來，儲存是最大程度減少訓練和推理瓶頸的關鍵元件，而為了實現更高的吞吐量和更低的延遲，谷歌此次在儲存層面也進行了一系列更新，包括：

Hyperdisk Exapools：提供超大規模器的最高聚合效能和容量塊儲存，每個 AI 叢集的容量高達 EB，效能高達每秒 TB 級；
隨處快取：能夠智慧地將資料儲存在靠近加速器的位置，將儲存延遲減少高達 70% ，並顯著加快訓練時間；
快速儲存：這是谷歌的第一個區域物件儲存解決方案，與最快的同類雲解決方案相比，隨機讀寫延遲降低了 5 倍。

軟體層面，谷歌推出了三項針對 AI 推理的重大增強功能，包括：

Google Kubernetes Engine (GKE) 推理：GKE 中的新推理功能，包括新一代 AI 感知擴充套件和負載平衡功能，可根據內部基準測試將服務成本降低 30% 、將尾部延遲減少 60% 並將吞吐量提高 40%；
Pathways 上線：由 Google DeepMind 開發，支援先進的多主機推理，可實現動態擴充套件，並以最優成本提供卓越的效能；
vLLM 可用性：將 vLLM 引入 TPU，使得已使用 vLLM 針對 GPU 最佳化 PyTorch 的客戶能夠輕鬆且經濟高效地在 TPU 上執行其工作負載，從而最大限度地利用其投資並提升靈活性。

AI 模型持續深入企業級場景

正是基於以上在 AI 超級計算機硬體和軟體等層面的持續效能提升，使得谷歌可以提供更加智慧、更低成本、更低門檻的 AI 工具，而這，恰恰是企業級規模化 AI 應用的重要前提。

其中，Gemini 作為谷歌功能最強大的 AI 模型系列，兩週前谷歌就提前釋出了 Gemini 2.5 Pro 公開預覽版。據 Pichai 介紹，Gemini 2.5 Pro 現已在 AI Studio、Vertex AI 和 Gemini 應用程式中向所有人開放。

而在本次大會上，谷歌方面再次宣佈，Gemini 2.5 Flash 即將登陸 Vertex AI。Gemini 2.5 Flash 是谷歌專為低延遲和成本效益而最佳化的主力模型，適用於即時摘要和文件探索，其特點是能夠根據提示的複雜程度調整推理水平。此外，響應時間也可以根據問題的複雜程度進行調整，這意味著它需要更長的時間來響應需要事實核查的查詢。

除了 Gemini，谷歌還是為數不多提供涵蓋所有模式（包括影像、語音、音樂和影片）模型的公司，所有這些模型在本次大會上也有突破性的進展：

Imagen 3（文字轉影像模型）：改進了影像生成和修復功能，可以重建影像中缺失或損壞的部分。此次更新顯著提升了物件移除的質量，帶來更自然、更流暢的編輯體驗，在 LMArena 上排名第一；
Chirp 3（音訊生成模型）：只需輸入 10 秒音訊就可以建立自定義語音，使企業能夠個性化配置呼叫中心、創作內容並建立獨特的品牌聲音。此外，新的轉錄功能還可以在多人對話中分離並識別單個說話人，顯著提高會議摘要、音訊分析和多方通話錄音等應用的轉錄清晰度和可用性；
Lyria（業界首款企業級文字轉音樂模型）：可以將簡單的文字提示轉換為 30 秒的音樂片段，能夠生成高保真音訊，捕捉細微的差別，並呈現豐富細膩且涵蓋多種型別的音樂，用於企業營銷活動、產品釋出、沉浸式店內體驗和其他數字內容創作；
Veo 2（影片生成模型）：推出智慧擦除功能，可以去除不需要的背景影像、logo 或干擾元素，無需手動修飾即可進行專業編輯；智慧擴充套件功能，能延展現有影片畫面素材，幫助使用者針對不同螢幕尺寸和平臺最佳化影片規格；電影級運鏡技術，提供專業級的鏡頭構圖、拍攝角度與節奏把控方案；智慧補幀，使用者只需設定影片片段的起始與結束幀，即可自動生成流暢的過渡畫面。

在演示中，Vertex AI 產品總監 Nenshad Bardoliwalla 展示瞭如何協同以上工具製作音樂會宣傳影片，並配有自定義音樂和複雜的編輯功能，例如從影片片段中刪除不需要的元素。看下來整體操作非常絲滑，Bardoliwalla 表示：“只有 Vertex AI 能夠將所有這些模型以及第三方模型整合到一個平臺上。”

值得一提的是，今年大會開場前的現場 DJ 表演中的音樂視覺效果也是由谷歌 DeepMind 的影片模型 Veo 2 生成。走 T 臺的花豹、水中徜徉的千紙鶴、吃冰淇淋的鸚鵡、水杯中跳水的運動員…… 這些馬行空的畫面和恰到好處的 BGM 卡點還是非常令人印象深刻的。

Vertex AI 模型矩陣擴充套件至 200+

平臺層面，我們看到 Vertex AI 自 2021 年釋出至今，已經從一個模型託管與訓練平臺，轉變成一個模型訓練和部署的綜合平臺。僅在去年，Vertex AI 上 Gemini 的使用量就增長了 40 倍以上，目前每月 API 呼叫量達數十億次。

透過自動化和加速常規關鍵任務流程，Vertex AI 幫助諸多企業顯著提升了業務效率。例如，電商巨頭 Wayfair 透過自動化產品目錄最佳化流程，屬性更新速度提升 5 倍，運營效率大幅提升；全球能源企業 AES 運用生成式 AI 代理自動執行安全審計，使得審計成本驟降 99%，耗時從 14 天壓縮至 1 小時；德國商業銀行（Commerzbank）為投資諮詢電話生成 AI 摘要，使得行政處理時間銳減 66%。

據 Kurian 介紹，Vertex AI 模型矩陣中目前擁有 200 多個模型，包括 Google 模型、來自 Anthropic、AI21 和 Mistral 等公司的第三方模型，以及 Gemma 和 Llama 等開放模型。最近，谷歌還添加了來自 CAMB.AI、Qodo 的模型，以及來自艾倫研究所 (The Allen Institute) 的完整開源模型組合。

在本次大會上，Vertex AI 也迎來了一系列新的進展：

Vertex AI 監控面板：可以即時追蹤使用量、吞吐量、延遲等關鍵指標，並提供錯誤診斷功能，讓企業可以全面掌握 AI 執行狀態；
模型訓練與調優：支援基於 Gemini、Imagen、Veo 等谷歌原生模型，以及嵌入、翻譯模型和 Gemma、Llama、Mistral 等開源模型，以安全可靠的方式使用自有資料進行定製化訓練與調優；
Vertex AI 模型最佳化器：依託谷歌對 Gemini 的深度理解，根據企業對質量、速度和成本的偏好，自動將查詢路由至最佳效能模型和工具組合；
即時 API（Live API）：透過流式傳輸音影片資料至 Gemini，實現真正的對話式互動，可以即時處理並響應富媒體內容，為沉浸式多模態應用開啟全新可能。

顛覆多智慧體生態互動模式

對於近兩年來始終處於 AI 應用頂流圈的 Agent，幾乎也是本次大會現場的重頭戲。鑑於現場資訊量很大，這裡著重挑選幾個關注度較高的釋出做下介紹。

其中最受關注的首當其衝是業界首個標準智慧體互動協議——Agent2Agent 協議。該協議旨在幫助企業支援多智慧體生態系統，使智慧體能夠相互打通而不受底層技術的限制，也就是說，無論它們是由哪個供應商提供的，或者是基於哪個框架構建的都不受影響。

這一特性使得構建由多個專職智慧體組成的企業級智慧系統成為可能。例如，在企業級流程中，某個智慧體可以負責候選人篩選，另一個安排面試時間，還有一個負責背景調查，而這一切都可以在統一的 agentic 介面中完成。

Kurian 表示：“Agent2Agent 協議目前可以支援包括埃森哲、Box、德勤、Salesforce、SAP、ServiceNow 和 TCS 等在內的 50 多家合作伙伴的企業應用平臺，他們有著共同的願景，即讓智慧體能夠在整個智慧體生態系統中更順滑地執行。”

谷歌強調的這種互操作性，意味著谷歌把自己定位為異構 AI 生態系統中的連線點，這或許也預示著其正在擺脫雲計算早期階段那種封閉式的模式。

與此同時，面向非技術人員，谷歌還升級了 Google Agentspace，包括 Agent Gallery 和 Agent Designer 等，用以幫助每一位企業員工用好 AI。在演示中，谷歌展示了一位銀行客戶經理如何使用這些工具分析客戶投資組合、預測現金流問題，並自動起草與客戶的溝通——所有這些都無需編寫任何程式碼。

Kurian 透露，Agentspace 現已整合到 Chrome 瀏覽器中，這意味著使用者可以直接在瀏覽器中搜索公司資料，從而簡化工作流程並提高工作效率。

與此同時，谷歌還升級了 Google Agentspace，用以幫助每一位員工用好 AI。Kurian 透露，Agentspace 現已整合到 Chrome 瀏覽器中，這意味著使用者可以直接在瀏覽器中搜索公司資料，從而簡化工作流程並提高工作效率。

應用場景層面，谷歌現場演示了一系列 Agent，主要包括 Customer Agents、Creative Agents、Data Agents、Coding Agents 和 Security Agents 五大類。

其中 Customer Agents 能夠綜合和推理企業面向客戶的業務場景中各種不同型別的多模態資訊，包括文字、音訊、影像和影片等等，並且以類似人類的語音和對話方式自然地進行溝通和互動，能夠代表使用者連線企業應用程式。不得不說，現場演示的 demo 還是比較驚豔的。

Data Agents 在企業工作流中也是非常重要的一部分，藉助谷歌資料平臺 BigQuery 企業可以充分整合結構化和非結構化資料，並使用直接整合到 BigQuery 中的 Apache Iceberg 等開放格式，此外還可以使用 BigQuery 訪問任何儲存系統、任何 SaaS 應用或任何雲平臺中的資料。

Coding Agents 應該是業界目前大家最為熟悉的應用場景，據介紹，如今谷歌已有超過 25% 的新程式碼都是由 AI 生成，然後再交由工程師稽核。Gemini 的快速效能、超長的上下文視窗和先進的推理能力使其非常適合用於編碼輔助。目前，谷歌已經在 Google Cloud、Android Studio、Firebase Studio 以及 IDE 中提供 Gemini Code Assist，隨著最新的 Code Assist Agent 釋出，將進一步幫助使用者實現從程式碼到整個軟體開發生命週期的各項工作的提效。

“未來將由我們所有人共同建設”

“我們正在提供一系列令人驚歎的創新，並讓這些創新輕鬆地融入到企業現有的技術環境中。”Kurian 表示，Google Cloud 正致力於透過以下四個主要方式讓谷歌的創新更容易被採用：第一，更好的跨雲網絡；第二，透過與 ISV 的合作改善 Google Cloud 整合方式和效率；第三，透過與服務合作伙伴合作推出各型別的 Agent；第四，透過 Google Cloud 提供開放的多雲平臺並構建互操作性，進而加快 AI 應用的價值實現速度。

“我們很榮幸能與大家一起攜手構建這種全新的雲服務方式，未來將由我們所有人共同建設” 。Kurian 強調。

可以看到，經過多年的前沿技術革新，谷歌對 AI 邊界的探索正不斷拓寬，從單一工具到端到端的 AI 平臺，從通用領域到垂直行業，從封閉到開放生態的構建，從 AI 試水到規模化部署。現如今，谷歌的模型 + 平臺 + 晶片三位一體的差異化優勢正逐步顯現。

7500 萬竟滾成 2.5 億巨坑，違約還沒後果！這家“皮包”科技公司把美政府“忽悠”瘸了，延期 2 年還不斷甩鍋！

Meta開源Llama 4，正面迎戰 DeepSeek！經過重新設計，首次採用MoE

DeepSeek打擊面太廣！新論文疑是R2釋出前兆，奧特曼火速“應戰”：o3即將上線，GPT-5免費放送！

活動推薦

由北電數智主辦的首屆酒仙橋論壇，將於 2025 年 4 月 15 日 -20 日在北京數字經濟算力中心舉辦。本屆論壇以“AI 開啟新質生產力元年”為主題，匯聚產學研各界專家，聚焦“產業創新應用、生態發展與數智未來”三大議題，深入解析 AI 技術演進方向，挖掘場景落地實踐，連結技術、資本與產業資源，推動科技與產業深度融合。

圍繞 AI 在科研和工業場景的創新應用，酒仙橋分論壇特設「星火國產 AI 原生專場」，邀請產業鏈上下游的標杆企業與高校 / 科研機構，共探 AI 的產業融合之道。感興趣的小夥伴可以掃描二維碼或者點選閱讀原文預約直播。