
編輯 | 楊文
由於總被 OpenAI 搶頭條,國內網友給谷歌起了個響亮的綽號 ——AI 圈汪峰。
吃的虧太多,谷歌這次終於變聰明瞭。
本來 Google I/O 開發者大會得在 5 月 20 日舉行,可為了防止 OpenAI 中途截胡,谷歌不惜提前兩週祭出 Gemini 2.5 的最新版本 ——
而這個版本最大的進步在於程式設計能力的提升,不僅在 LMArena 程式設計排行榜拿下第一:

還在 WebDev Arena 排行榜上超過了 Claude 3.7 Sonnet :

舉個例子。
X 網友 @Yuchenj_UW 使用同樣的提示詞:Code simulation of water in a bucket that is rocking back and forth.(編寫模擬水桶中的水來回搖晃的程式碼)分別丟給 Gemini 2.5 Pro、Claude 3.7 Sonnet 和 o3。
Gemini 2.5 Pro 的效果:

Claude 3.7 Sonnet 的效果:

o3 的效果:

這三款大模型的程式設計能力是個啥水平,一目瞭然。
有網友評論稱,經過測試發現,Gemini 2.5 Pro 處理物理系統和空間邏輯的能力也遠超 o3 或 Claude Sonnet,它似乎能夠保持更精確的約束傳播和時間一致性,尤其是在多步模擬中。

在做遊戲方面,Gemini 2.5 Pro 看上去也很趁手。
有網友僅用一張參考圖片,就讓 Gemini 2.5 Pro 建立了一個類似超級瑪麗的跳躍遊戲。
https://x.com/npaka123/status/1919934233981718921
還有網友把自家狗子的照片餵給 Gemini 2.5 Pro,然後輸入提示詞:Code a game based on my dog,秒變 4399 小遊戲。
https://x.com/testingcatalog/status/1919802147664761069
Gemini 2.5 Pro 也能一口氣搞定一款吃豆人小遊戲,用該網友的話來說,就連 o3、o4-mini 等都比不上這個輸出。
https://x.com/SaiNemani1/status/1919939076351733796
Google DeepMind 研究科學家 @jalayrac 將 Gemini 2.5 Pro 的程式設計能力與 Gemini 的前沿多模態影片理解功能相結合,竟然可以將一段 YouTube 影片轉化為 p5.js 動畫。
https://x.com/jalayrac/status/1919842485003530353
看大家玩得不亦樂乎,我們也決定上手體驗一把。
我們上傳了一張星空圖,然後輸入提示詞:
用程式碼模擬這張圖片在自然環境中的典型動態行為。

雖然 Gemini 2.5 Pro 生成的夜空背景烏漆麻黑,不如原圖高階,但它在左上角生成了三個引數調整器,拖動游標即可調整旋轉速度、星星數量和閃爍強度,響應非常精準。

https://g.co/gemini/share/9fa8fc467d8a
我們借鑑了 X 網友 @chetaslua 的提示詞:
make a website to show me how the Earth was formed (scientifically believed) in 3D prompt , give full code block. 建立一個 3D 動畫網站,展示地球是如何形成的(基於科學理論),並提供完整的程式碼塊。
Gemini 2.5 Pro 不僅將地球演化的 7 個階段以 3D 動畫的形式表現出來,還為了方便使用者理解附上了文字解讀。
當然,它生成的 3D 動畫還不夠精美,尤其是模擬的星球遠遠看著像個煮熟的雞蛋。

https://g.co/gemini/share/efd6a4fc980f
我們還整了個辦公室摸魚小遊戲。為了讓生成效果更佳,我們請出了老搭檔 ChatGPT,讓它來寫提示詞。
請幫我生成一款適合上班摸魚時玩的 “逃生” 類網頁小遊戲的程式碼,要求如下:【遊戲目標】 玩家需在一個虛擬辦公室場景中悄悄完成逃離任務,但不能被老闆或監控發現。玩法可以是找出口、點物品、解謎、路線規劃等,輕度策略為主。遊戲需設定一些干擾機制(如老闆巡邏、攝像頭移動),增加緊張感。【設計要求】介面風格極簡,畫素風或手繪風皆可,顏色柔和;使用者主要透過滑鼠點選或鍵盤方向鍵控制角色或選擇操作;頁面不要發出聲音(避免上班時暴露);不使用伺服器、不載入大圖片,適合瀏覽器本地執行;遊戲不應超過 3 分鐘即可通關,適合碎片時間玩;可加一個 “老闆來了” 按鈕,點選後立刻切成 Excel 模板畫面(有趣的彩蛋)。
只要把以上提示詞全部複製貼上給 Gemini 2.5 Pro,它就能輸出一堆程式碼,並自動給出預覽。
玩法也很簡單,使用方向鍵移動遊戲角色(🟩)到達出口 (🚪) 即可,不過要躲開老闆 (🟥) 和監控探頭 (🟡) 的視線。

https://g.co/gemini/share/6d03c78e9c9f
更有趣的是,我們點選下方的「老闆來了!」按鈕,就會彈出一張 Excel 表格,裡面記錄著電子牛馬們手頭乾的活。

當然,和其他大模型一樣,Gemini 2.5 Pro 經常會抽風。
Transform this image into a code-based representation of its natural behavior.
Gemini 2.5 Pro 並沒有模擬出花朵綻放的效果,只是讓牡丹的莖長高了點。

最後再說個題外話。
前段時間,谷歌針對美國學生使用者推出了免費使用 Google One 會員功能。
就在昨天,谷歌突然卡 bug,活動申請頁面取消了 edu 學生郵箱等驗證的步驟。
這就意味著,普通使用者只需登入 Google 個人賬戶,就可以免費領取 Google One 會員到 2026 年底。

成功領取後, 就可以體驗 Gemini Advanced、NotebookLM Plus、2TB Google Drive 等功能。

不過值得注意的是,這僅限美國 IP,還要使用谷歌瀏覽器。
領取地址:https://gemini.google/students/
以後我們會帶來更多好玩有用的 AI 評測,也歡迎大家進群交流。

© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]