「搶跑」GPT-5!Google釋出最強AI全家桶,史上最貴AI會員定價1800元/月

去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙擊。
今年攻守之勢異也。
前幾天 OpenAI 透露 GPT-5 將 All in One,整合各種產品。剛剛,Google 就把這個思路貫徹到  I/O 大會,直接掏出了自家有史以來最強的 AI 全家桶。

從 Gemini 2.5 Pro/Flash 模型,到 AI Mode,再到 Veo 3、Imagen 4,以及面向開發者與創作者的 AI 套件等,Google 幾乎把從模型到產品的路徑都壓縮到一場釋出會裡。
更準確地說,當下最火的 AI 應用場景,都被 Google「預埋」進了產品接口裡,讓人無法忽視它作為全球同時具備工程實力和生態整合能力的 AI 巨頭硬實力。

也難怪許多網友調侃,將近兩個小時的釋出會過後,又將有一大批初創公司死於 Google 之手。
不過,也不難看出,釋出會上有一些功能仍停留在「預告片」和小範圍測試階段,距離真正的落地或許還有不小的距離。
此外,Google 還正式釋出了 Android XR 產品和技術線的最新一代產品:與 Xreal 共同推出的首款輕量級智慧眼鏡產品 Project Aura。(更多細節請留意後續的另一篇報道)

幫我「買票 + 找座 + 填表」一口氣搞定,Google 新 AI 搜尋卷瘋了
AI 正在重寫搜尋的底層邏輯。
在去年的 I/O 大會上,Google 推出了 AI 概覽(AI Overviews)功能,至今已擁有超過 15 億的月活躍使用者。
生成式 AI 逐漸改變了人們的搜尋方式,但隨之而來的卻是,我們不再滿足於在搜尋框裡輸入簡單的問題,而是丟擲更復雜、更長、更具多模態的提問。

今天,Google 再次加碼搜尋與 AI 的融合,推出一種端到端的 AI 搜尋體驗——AI Mode。
正如 Google CEO 桑達爾·皮查伊介紹的那樣,這是 Google 有史以來最強大的 AI 搜尋形態,不僅具備更先進的推理能力和多模態理解能力,還支援透過上下文追問和網頁連結進行深度探索。
例如,當用戶面對一個需要複雜解讀的搜尋問題,AI Mode 可啟動「深度搜索」機制,不同資訊之間進行推理,並在幾分鐘內生成一份專家級的引用報告,為你節省數小時的研究時間。
與此同時,Google 也將 Project Astra 的多模態能力接入搜尋,進一步提升搜尋的即時互動性。透過 Search Live 功能,使用者只需開啟攝像頭,即可透過畫面即時提問並獲得反饋。
今年是 Agent 元年,Google 也很貼心地推出了 Project Mariner Agent 功能,能幫助使用者更高效地完成任務。
例如,只需一句「幫我找兩張週六比賽的實惠票,位於下層座位」,AI Mode 便能自動跨多個票務平臺檢索選項,即時比較價格和庫存,並完成表單填寫等繁瑣操作,大幅提升效率。
藉助 Gemini 模型和 Google 購物圖譜的強大支援,Google AI Mode 能夠幫助你縮小商品範圍並提供靈感。如果你想看看衣服穿在自己身上的效果,只需要上傳一張自己的照片,就能實現虛擬試穿衣服。
此外,AI Mode 也具備強大的個性化能力,能根據使用者上下文偏好給出定製化建議,還可生成圖表和視覺化結果,尤其在體育和金融類搜尋中表現出色。
該功能今日起已在美國全面上線,未來將推廣至更多地區。
會寫程式碼、還省 Tokens,Gemini 拿到了「學霸」人設
在模型能力方面,Google 此次釋出了 Gemini 2.5 Pro 的 I/O 版本,在各大排行榜上獨佔鰲頭。
現在,Gemini 2.5 Pro 引入了名為「Deep Think」的推理增強模式。這項功能可在生成答案前考慮多個假設,從而更深入地理解問題背景。
2.5 Pro Deep Think 在 2025 年美國數學奧林匹克(USAMO)以及 LiveCodeBench(程式設計基準)排名領先,並在 MMMU(測試多模態推理)中獲得了 84.0% 的分數。
不過,Google 表示,將會花更多時間進行前沿安全評估,並徵求安全專家的進一步意見。作為第一步,Deep Think 功能目前將透過 Gemini API 向小範圍測試者開放。
同樣得到升級的還有注重效率的 Gemini 2.5 Flash。
新版 2.5 Flash 在推理、多模態、程式碼和長上下文等關鍵基準上都有了改進,同時在效率上更高,評估中使用的 tokens 減少了 20% 至 30%。
2.5 Flash 現已在 Gemini 應用程式中向所有人開放,並將在 6 月初透過 Google AI Studio 面向開發者和 Vertex AI 向企業全面釋出。
開發者體驗上,2.5 Pro 和 2.5 Flash 將在 Gemini API 和 Vertex AI 中引入了「思維摘要」功能,可將模型的推理路徑以標題、關鍵資訊和呼叫工具等方式進行結構化呈現。
開發者也將從中受益,Google 宣佈在 Gemini API 和 SDK 中正式支援 MCP 工具,讓開發者可以輕鬆接入更多開源工具和外掛生態。
音樂、電影、影像全套上線,Google 把 AI 玩出了花
本次釋出會,Google 帶來了新一代影片和影像模型——Veo 3 和 Imagen 4。
與傳統影片生成不同,Veo 3 是一款支援音訊的影片生成模型,能在城市街景中模擬交通、鳥鳴,甚至角色對話,顯著提升沉浸感。

該模型不僅在文字和影像提示的基礎上生成影片,還能精確實現物理環境與口型同步,極大提升了影片創作的真實感。
目前,Veo 3 已在 Gemini 應用和 Flow 平臺上向 Ultra 訂閱使用者開放,並已在 Vertex AI 平臺上為企業使用者提供支援。
上文提到的 Flow 正是 Google 為創作者打造的一款 AI 電影製作工具。
使用者只需用自然語言描述電影場景,即可管理演員、地點、道具和風格,自動生成敘事片段。Flow 已在美國向 Gemini Pro 和 Ultra 使用者開放,全球範圍的推廣也在推進中。
在影像生成方面,新版 Imagen 4 提升了精度與速度,細節表現上可逼真展現織物、水滴與動物毛髮,同時也能生成偏抽象型別的風格。
它支援 2K 解析度和多種長寬比生成,在排版和拼寫方面也有顯著最佳化,適合製作賀卡、海報甚至漫畫。
Imagen 4 今日已在 Gemini、Whisk、Vertex AI 以及 Workspace 的 Slides、Vids 和 Docs 中上線,據悉,未來還將推出速度快十倍的版本。
在音樂創作方面,Google 擴大了 Lyria 2 驅動的 Music AI Sandbox 的訪問許可權,並上線了互動式音樂生成模型 Lyria RealTime。該模型現已透過 API 和 AI Studio 向開發者開放。
考慮到由 Veo 3、Imagen 4 和 Lyria 2 生成的內容將繼續帶有 SynthID 水印,Google 釋出了全新的 SynthID Detector。
使用者只需上傳檔案,即可識別其中是否包含 SynthID 水印,用於防偽和追蹤 AI 內容來源。
Google 要造「世界模型」,連任務都能幫你做了?
Google 希望將 Gemini 打造成一個「世界模型」,既能計劃、理解,也能模擬現實世界的各個方面。
Google DeepMind CEO Demis Hassabis 表示,這一方向正是 Project Astra 的核心理念之一。
過去一年裡,Google 已將影片理解、螢幕共享、記憶功能等逐步整合進 Gemini Live。如今,Gemini 新的語音輸出加入了原生音訊,更加自然;記憶與 computer use 能力也同步增強。
此外,Google 還在探索如何利用 Agent 能力幫助人們處理多工。
Project Mariner 就是其中之一,能夠同時完成最多十項任務,比如資訊查詢、預訂、購物與調研。已面向美國 Ultra 使用者開放,並即將整合至 Gemini API 與其他核心產品中。
AI 新功能扎堆釋出,會誕生真正的殺手鐧嗎
NotebookLM 官方昨日宣佈,上線 24 小時就已經成為 App Store 中排名第 2 的生產力應用和第 9 的整體應用。
作為 Google 在 AI 筆記工具上的一次重要探索,NotebookLM 提供音訊概覽和思維導圖等功能。
其中,音訊概覽目前已支援超過 80 種語言,而本週,Google 也宣佈將為這一功能引入更高的可定製性,使用者可根據需要選擇摘要的長度,無論是快速瀏覽還是深入閱讀都不在話下。
這項功能首先將在英語中推出,隨後將擴充套件到更多語言。
與此同時,Google 也在回應使用者對視覺呈現的訴求,即將在 NotebookLM 中加入影片概覽功能,使用者只需一鍵即可將筆記內容轉化為教育類影片,用更直觀的方式傳遞資訊。
在 AI 程式設計領域,Google還帶來了 Jules 的最新進展。
這個最初出現在 Google Labs 的自主編碼助手,能夠理解程式碼並自主完成諸如編寫測試、構建功能和修復 Bug 等開發任務,如今已經正式進入公開 Beta 測試階段。
此外,Google 還推出了全新的訂閱服務 Google AI Ultra。
該計劃為專業使用者提供 Google 最強大模型和高階功能的無限制訪問,適合電影製作人、開發者、創意工作者等專業人士,月費為 249.99 美元(摺合人民幣 1804 元)。
目前,該計劃已經在美國上線,並將很快擴充套件至其他國家。
實際上,AI 如今不缺模型,也不缺功能,真正稀缺的,是一個能嵌入日常生活、真正打進主流使用者心智的「殺手級產品」。
Google 當然明白這個道理,也正全力以赴尋找答案。
因此,我們看到,在這次的釋出會上,Google 幾乎什麼都做了,也什麼都提了:從文字、影像、影片、音樂,到搜尋、Agent、創作工具,一應俱全。
牌已經亮完,技術也到位,現在,Google 只差一記真正擊中使用者痛點的落子。
我們正在招募夥伴
📮 簡歷投遞郵箱[email protected]
✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結)

相關文章