

2023
大公司報道
BUSINESS

被逼急了的谷歌,開始展現真正的實力。
文| Juny 編輯| VickyXiao
時隔三年,品玩/矽星人終於又回到了谷歌IO大會的現場。
在跟谷歌矽谷總部一街之隔的 Shoreline Amphitheatre露天劇場上,開發者和媒體參會者們早早地聚集於此。相較於過去這兩年人文氣息偏重、重磅產品較少的IO大會,已經拉響了紅色警報的谷歌今年顯然卯足了勁,無論還是 AI更新還是全新的硬體產品,今年穀歌IO都可以說是近幾年來少有的一場科技盛會。
尤其突出的是,谷歌此次重磅打出了一系列AI組合拳,旗下幾乎所有產品都開始跟AI進行全面整合、並進行跨越式升級。在當前AI競賽中起跑慢了一步的谷歌似乎已經不再藏著掖著,作為AI領域的長期領導者,在本次IO上,谷歌充分向大眾展現了其巨大的AI能量和潛力。
在正式Keynote開始之前,現場首先預熱了幾首由谷歌全新音樂AI工具MusicLM 和 Bard參與創作的迷幻電子音樂。

現場播放的AI製作的音樂《ducks with lips》,矽星人現場拍攝
在一片歡樂的氣氛中,谷歌CEO皮柴登場,幾句簡單的寒暄後他直擊主題,“眾所周知,人工智慧今年非常忙碌,而作為一家 AI-first 公司,我們有很多話要談。所以,讓我們開始吧。”
|Gmail、Maps等AI升級,創造更智慧的生活體驗
活動的一開始,谷歌先上了幾個“開胃前菜”。皮柴表示,谷歌的AI技術其實已經被大量融入到了一些跟使用者日常生活息息相關的軟體之中,比如Gmail、Google 地圖和圖片編輯。
首先,大家期盼已久的Gmail自動寫郵件功能終於來了。早在2017 年Gmail就推出了郵件的Smart Compose一鍵簡短回覆功能,而今天,谷歌在此基礎上推出了一個名為“Help Me Write”的全新功能,能夠幫助你快速撰寫完整的郵件和回覆。
在IO上,谷歌展示了一個向航空公司申請退款用例,你只需告訴Gmail你想要退款的意圖,它就會根據你的航班詳情寫一份完整的郵件,同時也可以調整不同的語氣。

谷歌Map則引入了一個全新的3D沉浸式路線檢視功能。在 AI 和計算機視覺技術的幫助下,谷歌將數十億張航拍和街景影像融合在一起建立了空間 3D 模型。也就是說,未來你用Google Maps進行路線導航時,你看到的不僅只是從A到B的2D路線,而是能夠以視覺化的形式看到道路和周邊的建築情況,甚至包括當地即時天氣、交通等。
谷歌表示,這個功能將在今年很快上線,首先將在包括阿姆斯特丹、柏林、都柏林、佛羅倫薩、拉斯維加斯等15個城市推出。

此外,名為Magic Editor圖片編輯功能讓小白也能輕鬆改圖。跟蘋果此前的圖片功能類似,Magic Editor可以對照片中的不同事物進行識別,並允許你用拖拉拽的方式進行編輯。比如把人往左邊右邊拉一下,讓構圖更加符合你的想象。

|最強語言模型PaLM2亮相,Bard能力爆炸躍升
幾個小功能熱身之後,接下來,谷歌此次真正的硬菜開始接連登場。首先,像此前大家猜測的一樣,谷歌推出了下一代超強語言模型PaLM 2。
PaLM 是 Google 在 2022 年 4 月宣佈的大語言模型,使用了5400 億引數進行訓練,約是GPT-3的三倍。此次PaLM 2又在PaLM上進一步進行了提升和改進,具有多語言、推理和編碼功能。
PaLM 2 在多語言文字方面接受了更多的訓練,涵蓋了 100 多種語言,對於理解、生成和翻譯包括成語、詩歌和謎語在內的細微差別文字的能力非常顯著,還通過了“精通”級別的高階語言能力考試。

在推理方面,PaLM 2 的資料集包括科學論文和帶有數學表示式的網頁,擁有超強的邏輯、常識推理和數學能力。

同時,PaLM2在大量公共原始碼資料集上進行了預訓練,寫程式碼能力更強了。除了 Python 和 JavaScript,還包括在 Prolog、Fortran 和 Verilog 中生成專用程式碼等。
值得注意的是,PaLM 2已經被開發出了不同的版本,可以面向不同的客戶、部署在不同企業環境中。
目前,PaLM 2有四種規格,從小到大依次為Gecko、Otter、Bison和Unicorn,其中,體積最小的Gecko可以在手機上執行,每秒大約可處理20個Token,也就是約16或17個單詞。也就是說,開發者們不用花費大量的時間和資源來建立和調整PaLM 2,而是能夠直接拿來就用進行部署。

在谷歌內部, PaLM 2也早已經被用在了自家的25項功能和產品之中,其中也包括AI聊天機器人Bard、谷歌的全線辦公套件等。
在PaLM 2的加持下,此次Bard也開始真正的顯現出“ChatGPT殺手”的實力。
此前Bard是基於LaMDA 開發,該模型擁有1370億種引數,但現在Bard已經全面轉用PaLM,在答案生成的資料組和更多元化的內容方面能力飛昇。同時,谷歌將Bard跟旗下和外部產品的整合,讓Bard也跳出了聊天機器人的範疇,而是真正讓其成為了一款實用性工具。
比如現在Bard為你提供答案時,除了文字之外,還能提供包括圖片、影片、外部連結等多元化的資訊。

比如你在問了Bard問題之後,你現在可以將這些問題答案一鍵匯出到Gmail、谷歌文件、表格之中,Bard還可以動幫你給圖片、文件等做加標註。未來也將支援更多谷歌應用程式和Bard的整合體驗,包括Drive、地圖等。
對於軟體工程師們來說,Bard提供了改進後的程式碼引用功能,在提供來源的同時還能解釋程式碼片段。此外,現在開發者們也可以把Bard生成的程式碼進行匯出,不僅能傳送到谷歌的Colab平臺,還能和另一個基於瀏覽器的IDE Replit一起使用(目前支援首先Python)。
目前Bard能支援20多種程式語言,基本涵蓋了工程師們所有程式設計開發需要,併為開發者們提供了新的深色介面。開發者們只需輸入prompt就能得到完整的程式碼片段。

此外,跟ChatGPT類似,Bard現在也可以跟其他外部工具進行整合使用。在IO上谷歌也展示了一個Bard跟Adobe Firefly合作生成圖片的例子,比如你想給孩子辦一個生日派對需要做一個請柬照片,所要做的就是給Bard說“製作一張在兒童派對上獨角獸和蛋糕的影像”,接著在Adobe的支援下它會在幾秒鐘內生成四張影像。這不就是Midjourney複雜操作方法的替代嗎?

除了Adobe之外,Bard目前還在推進跟更多外部工具的整合使用,包括 Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academy等。
尤其重要的是,現在人人都可以用上Bard了。谷歌此次取消了等候佇列,Bard將面向180多個國家和地區的使用者全面開放。此外在英語之外,還增添了日語和韓語兩種語言,未來將逐步支援40種語言的互動。
|回擊微軟Copilot,谷歌工作套件迎來“Duet AI”
今年 3 月,微軟宣佈推出Copilot之後,在生產力工具領域掀起了一場革命。谷歌當時馬不停蹄地也為其 Workspace 應用程式套件宣佈了一系列人工智慧功能,爭取在跟微軟的競爭中不掉隊。當時,這些人工智慧功能還比較零散,並沒有一個類似於Copilot這樣系統性的工具。
但在今天的IO上,谷歌終於給出了它的對標方案——Duet AI。

跟微軟Copolit類似,Duet AI將被全面整合至谷歌旗下的Work Space,包括谷歌文件、表格、幻燈片、會議、GmailMeet的自動會議摘要等等。同時還推出了一項名為Sidekick的新功能,能夠跨不同的谷歌應用程式進行閱讀、總結和回答文件中的問題。
比如在文件之中,直接輸入文章主題就能完整的生成一篇文章。
在谷歌表格中,僅需輸入一句話“遛狗業務客戶和寵物統計”就能自動生成完整的表格,包含狗、地址、電子郵件、日期、時間、持續時間和費用等,還可以透過自然語言命令來對錶格進行編輯。

在簡報中根據你的在側邊欄輸入的要求自動生成PPT和插圖,並且按時間要求幫演示者總結每一頁的演講稿的講話內容等等。

雖然這些功能我們在微軟此前辦公套件中都多多少少看到過,但對於谷歌來說,此次Duet AI的推出,讓我們看到了谷歌在面對Copilot等競爭對手時的應對能力。
而除了應用於辦公套件中之外, Duet AI 也將被應用於谷歌雲業務之中。藉助Duet AI,谷歌雲推出了一系列開發者工具,包括可以提供即時程式碼幫助,指出錯誤的同時推薦生成的程式碼塊,以及回答代碼和谷歌雲相關的問題等。該功能支援 Go、Java、Javascript、Python 和 SQL等多種語言。谷歌表示,目前在谷歌雲上進行 AI 的訓練速度提高了 80%,成本降低了 50%。
但目前,谷歌辦公領域的Duet AI功能還沒有對公眾進行開放,如果想試用這些新工具,需要先註冊“工作場景實驗室(Workspace Labs)”並加入等候名單。
|生成式AI上線谷歌搜尋,數十億使用者即將開啟搜尋新旅程
面對Bing的步步緊逼,作為谷歌的立身之本,搜尋業務此次也迎來了重大的AI更新。
跟Bing類似,在使用者搜尋問題之後,搜尋欄的下方會首先出現由AI提供的更直接的答案,以及與這個問題相關的圖片、連結、影片等。根據第一次提問返回的資訊,你還可以進一步進行互動查詢更多的資訊,知道你得到最需要的答案。

而當你打算透過谷歌搜尋併購買一款產品時,AI不僅能夠為你返回你需要的產品連結還能夠為你想購買的產品提供摘要,包括提醒你購買時需要注意的事項、產品的特點、最新的評論等等。
這種新的基於搜尋的AI 購物體驗建立在谷歌的 Shopping Graph之上的,該Shopping Graph 擁有超過 350 億個產品列表,是目前世界上最全面的、且動態更新的產品、賣家、品牌、評論和庫存資料集。但谷歌同時也強調,廣告與自然搜尋結果將被區分開來,不會影響使用者的使用體驗。

雖然AI功能登陸谷歌搜尋令人振奮,但在全球數十億使用者面前,谷歌的推進步伐仍然相對謹慎。跟Duet AI的工作場景實驗室(Workspace Labs)”類似,為了測試全新的搜尋功能,谷歌也設立了一個新的“搜尋實驗室(Search Labs)”,使用者如果想要訪問這新的搜尋功能,必須選擇一個名為 Search Generative Experience(簡稱 SGE)的功能。
此外,谷歌也強調並非所有搜尋都會引發 AI 答案,只有當 Google 的演算法認為它比標準結果更有用時AI 才會出現,而有關健康、財務等敏感主題的資訊則不會出現。
|一些全新的硬體亮相,首款可摺疊的Pixel手機問世
除了一系列AI更新之外,一些谷歌硬體粉也非常關注谷歌今年的產品更新,此次谷歌也誠意滿滿,拿出了首款摺疊手機、新的平板電腦和更親民的Pixel手機
-
Google的首款摺疊屏產品亮相,售價1799美元起
而今年的硬體產品中,關注度最高的當屬Google的首款摺疊屏產品 Pixel Fold。該手機的造型非常類似OPPO釋出的Find N系列,也採用“翻開即橫屏”的操作理念,讓使用者在使用摺疊屏內屏時無需在旋轉90度才可以達到全屏顯示的效果。
該機器的內屏使用了一塊7.6英寸120Hz OLED柔性顯示屏,螢幕比例為5:6,解析度為2208*1840,官方宣稱峰值亮度可達到1450nit。而外屏則為5.8英寸 120Hz OLED外屏,螢幕比例為9:17.4,解析度2092*1080,峰值亮度可達到1550nit。

Pixel Fold,矽星人現場拍攝
效能方面,Google Pixel Fold搭載了與Pixel 7系列相同的自研Tensor G2 處理器+ Titan M2 協處理器,配合12GB LPDDR5 記憶體 + 256/512GB UFS 3.1 儲存組成Google的“效能鐵三角”。Pixel Fold擁有4821毫安時電池,支援30W有線快充,但不出意外的話Pixel Fold應該算是今年售價超1萬元的旗艦產品中充電速度最慢的產品了。
在釋出會之前,Google宣稱Pixel Fold會擁有“Pixel級別的影像系統”,與爆料不同的是,Google Pixel Fold的後置鏡頭模組選擇了48MP廣角(支援OIS)+10.8MP超廣角+10.8MP 5倍長焦的三攝組合。

Pixel Fold,矽星人現場拍攝
該機擁有黑白兩個配色,12GB+256GB的版本售價1799美元(約12450元人民幣),12GB+512GB版本售價1919美元(約13280元人民幣),現在預定購買可免費獲贈一支Google在去年發售的 Pixel Watch手錶。
-
平板電腦終於迴歸,但不跟iPad搶市場
除去Pixel Fold之外,Google還在這屆I/O上正式釋出了另一款大屏產品:Google Pixel Tablet。這也是Google沉寂多年後重返平板電腦市場的第一款產品,它的定位與目前市面上的平板電腦不同,更像是一個家庭智慧終端裝置。

Pixel Tablet 圖源:Google
Pixel Tablet並不是一款剛公佈的產品,它的首次亮相是在一年之前。Google認為平板電腦更多的使用場景是在家中而非室外,它是智慧家居中樞,也是用於流媒體播放及視訊通話的多媒體終端。為此,Google為Pixel Tablet配備了一個磁力吸附的充電底座,讓它可以長時間處於有電的狀態。
Pixel Tablet依舊使用Google自研Tensor G2 處理器,搭配8GB執行記憶體,128GB/256GB儲存,售價499美元起(約3450元人民幣),不含底座。
-
入門級Pixel 7a釋出,新增紅藍CP雙色
廉價版的Google Pixel a系列一直都會在正代Pixel釋出的次年推出,Google Pixel 7a也不例外。該手機的外觀與Google Pixel 7採用了相同的設計語言,新增了更加活潑的珊瑚色和海洋藍兩個配色,更加適合有活力的年輕使用者。

矽星人現場拍攝
相比去年釋出的Pixel 6a,7a的升級主要體現在處理器與攝像頭方面。Pixel 7a使用了與Pixel 7系列相同的自研Tensor G2晶片,並且將鏡頭模組升級為64MP廣角+13MP超廣角的組合,成像質量將會有非常明顯的進步。
與Google Pixel 7系列不同的是,Pixel 7a僅有8GB+128GB儲存這一個容量可選,但卻分為支援Sub 6 5G與mmWave 5G(毫米波)兩個版本,其中Sub 6 5G版本的售價為499美元(約人民幣3450元人民幣),而mmWave 5G版本的售價稍貴,為549美元(約3800元人民幣)。
總體來看,今天谷歌IO是一場誠意滿滿的大會,在整個開幕演講中,谷歌多次提到“大膽而負責任(bold and responsible)”這個詞,試圖證明谷歌可以在對社會和業務負責任的同時仍然可以快速行動。
在此前的訪談中,皮柴曾表示谷歌並不擔心推出語言模型的步伐較對手慢,把事情做對比搶快更加重要。而現在,谷歌似乎已經做好了一切準備。
*參考資料:
END
喜歡這篇文章?



關注矽星人,帶你用本地視角看矽谷,全球視野看創新
關鍵詞
谷歌
功能
產品
使用者
語言