谷歌突發大招刷爆AI程式設計榜!網友:不用買Cursor了

MLNLP社群是國內外知名的機器學習與自然語言處理社群,受眾覆蓋國內外NLP碩博生、高校老師以及企業研究人員。
社群的願景是促進國內外自然語言處理,機器學習學術界、產業界和廣大愛好者之間的交流和進步,特別是初學者同學們的進步。
來源 | 量子位
作者 | 白交
因為大家太過熱情, Gemini 2.5提前重磅更新——
史上最強編碼模型Gemini 2.5 Pro Preview的I/O版。
只需一張手繪的草圖,就可以構建一個「繪圖變音訊」的網頁版應用。
其他遊戲、物件模擬等等也都可以透過一句提示完全搞定。
它在所有LMArena排行榜上均超越Claude位列第一,包括所有文字領域、視覺以及WebDev Arena排行榜。
為此,這也是有史以來單一模型首次橫掃文字、視覺和WebDev領域!
網友們表示,好傢伙,不用買Cursor了。

程式碼能力屠榜

此次更新的重點就在於編碼能力,包括不限於改進前端和UI開發,以及基礎編碼任務(例如程式碼轉換和編輯,以及建立複雜的代理工作流)。
以前端web開發來說,它目前在WebDev Arena排行榜上位列第一。這個排行榜專門用來衡量人類對模型構建美觀且功能強大的Web應用能力的偏好。
與之前版本相比,相當於上漲了147分。Demis Hassabis表示:no big deal。(doge)
目前像Cursor背後公司、Cognition和Replit等都使用了該模型。
具體來看看各種實際場景中的應用。
  • 影片轉程式碼
基於模型的影片理解能力,它可以從單個 YouTube 影片建立互動式學習應用。
就像這樣~跟之前模型版本相比,使用者介面也更加完善。
它在VideoMME 上獲得了84.8% 的得分。
  • 新功能開發
實現新功能意味著需要手動深入設計檔案,檢查元件以匹配顏色、字型、內邊距、外邊距和邊框等樣式屬性,然後手動編寫所需的 CSS 程式碼來準確複製這些視覺屬性。
但現在只需一句提示詞,就可以復刻風格,比如新增一個windows 95風格的影片播放器。
除此之外,它還增加了一些新功能,比如聽寫入門應用,只需說出你的想法,Gemini就能將創意變為現實。
目前,開發者可以透過Google AI Studio和Vertex AI在 Gemini API 中使用更新的 Gemini 2.5 Pro 開始構建。Gemini App的使用者也可以使用它。

Gemini取代Gemini

在官方部落格中,他們還表示:這個版本原計劃在幾周後的Google I/O大會上釋出,但由於Gemini 2.5太受歡迎,於是決定現在發。
這是基於 Gemini 2.5 Pro編碼和多模態推理功能所獲得的廣泛好評而做出的改進。
有一說一,Gemini 2.5這一系列確實受到不少關注。
就在前幾天,Gemini 2.5 Pro在直播中通關了《寶可夢藍》,成為首個大模型寶可夢聯盟冠軍,直接打破了此前Claude的記錄。
此次新版本一齣,有網友給出了高度評價:Gemini取代Gemini是一個訊號,表明有些事情已經發生了變化。
谷歌在各個方面都在穩步發展。頭把交椅仍會易主,但巨龍已經甦醒了。
那麼,問題來了,既然模型新版本這麼強大,為啥谷歌不更新版本號呢?(手動狗頭)

參考連結:[1]https://x.com/GoogleDeepMind/status/1919770265711419826[2]https://x.com/lmarena_ai/status/1919774743038984449[3]https://x.com/AndrewCurran_/status/1919813547212865770[4]https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/

技術交流群邀請函

△長按新增小助手
掃描二維碼新增小助手微信
請備註:姓名-學校/公司-研究方向
(如:小張-哈工大-對話系統)
即可申請加入自然語言處理/Pytorch等技術交流群

關於我們

MLNLP 社群是由國內外機器學習與自然語言處理學者聯合構建的民間學術社群,目前已經發展為國內外知名的機器學習與自然語言處理社群,旨在促進機器學習,自然語言處理學術界、產業界和廣大愛好者之間的進步。
社群可以為相關從業者的深造、就業及研究等方面提供開放交流平臺。歡迎大家關注和加入我們。


相關文章