谷歌回答你:如何讓每個人的AI都獨一無二

果殼連續作為受邀媒體在現場參與Google I/O開發者大會,尤其是進入AI時代這三年,持續見證了Google對於AI理解和表達的連貫和變化。
在今年的 Google I/O 大會上,Sundar Pichai(Google CEO)公佈了一組最新資料:
Google 的產品和 API 每月處理 token 數量已超過 480 萬億;
Gemini 活躍開發者超 700 萬;
Gemini 應用目前的月活躍使用者已超過 4 億。
而作為這四億分之一,我更關心的,是我使用的 AI 如何更適合我?有點像買鞋,或者處物件。Pichai 回答說:它們(AI 智慧體)會在每位使用者的控制下代表其執行操作 (on your behalf and under your control)。
一切的指向,是 AI 如何服務每一個與眾不同的個體。想象那些曾經驚豔過你的科幻智慧機器:R2D2 與天行者父子,機器貓和野比大雄,對了,還有最暖的 Javis 和大白(Baymax)……它們溫柔、高效,又忠誠。
於是,Google 開始試著回答這個問題:如何讓每個人也擁有和它們一樣的 AI 助手?
在今年的 I/O 大會上,Google 的答案中不斷重複著三個關鍵詞:Personal(個性化),Proactive(主動性),Powerful(強力的)。
嗯,3P 原則。(……誒,我在說 AI,你在想什麼……)
Personal:一個私人助手的自我修養
自動回覆這件事本不新鮮,問題是收到自動回覆後的第一感覺,一定不是對方的高效,而是撲面而來的冷漠——但我又是個時刻揹負著與人為善思想包袱的人,咋整?
於是 Gmail 新發布了一個名叫“個性化智慧回覆”功能(夏季上線)。Gemini 可以根據你過去的電子郵件和 Google 雲端硬碟中的資訊來起草電子郵件,讓郵件自動回覆更符合你的語氣——這也是個好機會,讓你可以反思一下自己線上溝通的語言習慣,到底是溫暖還是冰冷,還是喜歡陰陽怪氣。
Google Meet 釋出了的視訊通話中即時語音翻譯功能。它能即時翻譯你說的話,同時保留你的聲音和語調,不會讓你在說母語和說外語的變化中,尷尬得判若兩人。最開始會支援英語和西班牙語,未來幾周還會有更多語言加入。
對我來說,這項功能最大的利好,就是我那個英語專八的倒黴同事再也不能在我面前得瑟了。
你大概還記得去年我們在 I/O 現場對 Project Astra 的體驗?今年,期貨終於變成了現貨——一條通向真正“世界模型”的通道,透過手機或眼鏡觀察世界、模擬世界、理解世界,甚至再造世界。這比任何單純文字和語音的溝通,都更接近我們理想化的個人助手。
這次,Google 把 Project Astra 放進了名為 Gemini Live(蘋果系統和安卓系統都已經可以使用)的應用中。
Live 功能介面
在幾段演示片段裡:它可以即時指導你修理腳踏車,包括線上查詢說明書、識別修理位置的具體問題、在堆滿雜物的工具間尋找零件,甚至在有人來叫你吃飯時自動停止,並在之後繼續;你可以舉著孩子從學校帶回來的手工作業,讓 Gemini 幫你發現其中可以增強最佳化的地方;當你神經兮兮地指著自己的影子,問它問啥有人跟蹤自己時,它也能立刻告訴你“別怕,那只是你的影子”,而且保證不會對你翻白眼……
更多時候,你可以在開會時,把老闆潦草混亂的板書拍進 Gemini,自動進日曆和備忘錄,然後盡情走神摸魚;或者把你媳婦兒出門前留給你任務紙條拍進鏡頭,自動生成一個週末的 to-do-list,該做的家務和該買的商品一件不落,晚上不會捱揍。
根據演示展臺工作人員的介紹,這種協助行為同樣可以是個性化的,對你經常面對的問題或經常忽略的問題給予重點提示。
偷懶和增效不過是一體兩面,AI 助手大概也不在乎這些。
Proactive:AI 敏而好學,人類不恥長(常)問
Google的大會,那避不開“搜尋”。
我一直期望,AI 可以幫我解決一個長期困擾著全人類的世紀難題:今天中午吃點嘛?
開啟陳舊演算法主宰的各種本地生活應用,只會日復一日地推薦你吃過的和付費推廣店鋪,這種所謂的“主動推薦”讓我每天中午都無比被動——理想的午餐答案一定是既要又要,懂我的口味,又不斷推陳出新。
AI 加持下的搜尋,就提供了另一種主動的協助。今年 I/O 上,Google 為自己的搜尋疊加了一個名為 AI Mode 的模式。相比去年上線的 AI Overview,最新的 AI 模式能承載更多的“動作”。
就以我糾結的午飯難題為例吧:
深度搜索 (Deep Search): 針對我每天不厭其煩的問題“北京大望路到底有什麼午飯可吃”,AI 模式下的 Google 搜尋將執行數百次搜尋,整合每一次收集出的不同資訊,並在幾分鐘內生成專家程度堪比“朝陽區包打聽”的餐館清單,包含了時間、價格、評價,是否外賣等等;
即時功能 (Search Live): 要是我午飯前太忙,連上面的清單都懶得看,還可以使用 AI 模式搜尋中 Project Astra 的即時能力——拍一張辦公桌窗外的馬路,說:就在這個範圍內找口吃的;
代理功能 (Agentic Capabilities): 忙到出不了門的話(其實都是裝給老闆看的),AI 模式搜尋可以呼叫 Project Mariner 的代理能力,在選擇的搜做結果中自動下單叫外賣,這其中就包括了幫你比價、比配送時間、比評價口味等,到底是天橋對面的沙縣,還是樓下拐角的拉麵;
個人情境 (Personal Context): 根據我過往的搜尋和消費,下單時候可以自動備註多放香菜不要算,贈送的咖啡別加奶,薯條多兩包番茄醬(當然,這些個人歷史資訊的使用都會獲得額外的通知);
自定義圖表和圖形: 最後的大招,你就是選擇障礙(我看就是不夠餓),那就把上述最佳化結果請 AI 模式拉一個數據圖出來,甚至做個“如何尋找午飯難題抓手和構建用餐飛輪”的 ppt,自己訂個會議室好好分析一下吧,看看為什麼自己這麼事兒事兒的……
為了口吃的這麼折騰,是病
最後,話說回來,如果你需要用上面所有功能,才能決定午飯內容,那你的同事早就吃完回來睡了一覺了。如此的話,我勸你還是跟我一樣,餓一頓吧,沒啥。
Gemini 不會厭煩或笑話你,但你自己會低血糖。
Powerful:目標是 Universal AI App
Pichai 在現場提到,Gemini 的終極目標,是成為一個 Universal AI app——也許可以這麼理解這個名詞:通用、跨平臺和裝置,以及真正的世界模型。
在今年 I/O 現場的釋出中,還有一些體現了這種願景的新發布:
首先,最受期待和歡迎的就是 Android XR 的公佈,智慧眼鏡上的安卓系統。多少人關於 Google Glass 的怨念終於得到了報償:外觀類似蘋果 Vision Pro 的“重型”XR 眼鏡將同三星和高通合作生產,代號 Project Moohan;外觀類似 Rayban Meta 的“輕型眼鏡”將同時尚眼鏡品牌 Gentle Monster 和 Warby Parker 聯合推出。
在現場“輕型版”原型機的時代體驗中,最大的感受是 Gemini 的互動流暢度的確大大好過其他市面上已有的類似產品。
其次是新發布的 Imagen4 和 Veo 3,其中最顯著的進步,是 Veo 3 成為了世界上首個原生支援音效、背景噪音和角色對話的影片生成模型。
在 Pichai 釋出演講的最後,他舉了一個“小例子”,從另一個應用角度展示了 AI“協助角色”的價值:還記得去年令人震驚的加州山火麼?一款透過 Google AI 加持的山火檢測應用,可以將對火險隱患的檢測範圍精確到 270 平方英尺(約 25 平方米),響應時間從原先的 12 小時縮短為 20 分鐘。
這麼好的助理,要說貴,也的確不便宜
但也總有人用使喚著“強力助理”,偶爾做一些蠢事,比如我:
幾個小時前,我坐在 I/O 會場,嘗試 Gemini 生成這篇稿件的大綱,為了能快點交差去展區閒逛,但最終還是推翻了它給我的六個不同版本,自己寫了,寫完一看:嘿,這不跟 Gemini 給我的第一版差不多麼……
AI 成為個人助手的時代,我終於活成了我討厭的老闆的樣子。
所以,AI 助理也不容易,是吧?我決定給它屬個名,算個績效,以資鼓勵。
作者:Gemini,臥蟲
封面圖和插圖來源:Google和作者
本文來自果殼,未經授權不得轉載.
如有需要請聯絡[email protected]

相關文章