
之前,OpenAI 一直狙擊谷歌的新產品。現在,這個迴旋鏢打回來了。
谷歌昨晚在 OpenAI 釋出會之前,釋出了兩個重量級更新,一個是最先進的影片生成模型 Veo 2,一個是文生圖模型 Imagen-3。

先給你看個影片:
打網球、揮拍、投籃、跑步,這不是運動會宣傳片,而是谷歌這次發的Veo 2生成的影片!它扛住了大幅度運動的考驗,我願稱之為年度尺度最大、效果最佳的影片模型!
拿 Sora 跟 Veo 2 對比一下,看完這個,瞬間感覺剛開的 OpenAI 訂閱不香了……
Sora 20 美元版:5 秒影片時長、解析度最高 720pSora 200 美元版:20 秒影片時長、解析度最高 1080pVeo 2:約 2 分鐘影片時長、解析度最高 4k
除了生成影片的引數,benchmark 表現也超越 Sora,一同比較的模型有 4 個,除了 Sora, 還有 Meta Movie Gen 和 Kling v1.5、Minimax。

谷歌這次釋出的 Veo 2 的幾項增強:
-
保真度:顯著改進細節、真實感和減少偽影。 -
準確度:更理解物理世界,懂得遵循詳細指令,能高度準確地表示運動。 -
相機控制:瞭解電影攝影的獨特語言,能建立各種拍攝風格、角度、動作。

說到指令遵循,我前幾天做的 Sora 實測,Sora 指令遵循能力差到難以置信。推特上一網友提供了一組切西紅柿的 Veo 2 和 Sora 的對比影片。
A pair of hands skillfully slicing a ripe tomato on a wooden cutting board.(一雙手熟練地在木菜板上切成熟的西紅柿)
Veo 2 演示效果:
Sora 效果:
家人們,就看看 Veo 2 的陰影、反射、力學和視覺效果,未免太真了吧!現在能這麼自然地處理物件互動的模型,誰還能拉出第二個來看看?
你們可以看一下,官方的演示影片:
prompt:Cinematic shot of a female doctor in a dark yellow hazmat suit, illuminated by the harsh fluorescent light of a laboratory. The camera slowly zooms in on her face, panning gently to emphasize the worry and anxiety etched across her brow. She is hunched over a lab table, peering intently into a microscope, her gloved hands carefully adjusting the focus. The muted color palette of the scene, dominated by the sickly yellow of the suit and the sterile steel of the lab, underscores the gravity of the situation and the weight of the unknown she is facing. The shallow depth of field focuses on the fear in her eyes, reflecting the immense pressure and responsibility she bears.(電影鏡頭中一位身穿深黃色防護服的女醫生,在實驗室刺眼的熒光燈照射下。鏡頭慢慢拉近她的臉,輕輕搖動以強調她額頭上刻著的擔憂和焦慮。她彎腰伏在實驗臺上,聚精會神地看著顯微鏡,戴著手套的雙手小心地調整焦點。場景的色調柔和,以病態的黃色套裝和實驗室的無菌鋼鐵為主,強調了局勢的嚴重性和她所面臨的未知的重量。淺景深聚焦於她眼中的恐懼,反映出她所承受的巨大壓力和責任。)
你們就說,能看出來這是 AI 生成的影片嗎?
如果說特寫鏡頭體現不出實力,那來看看這個:
Prompt: The camera floats gently through rows of pastel-painted wooden beehives, buzzing honeybees gliding in and out of frame. The motion settles on the refined farmer standing at the center, his pristine white beekeeping suit gleaming in the golden afternoon light. He lifts a jar of honey, tilting it slightly to catch the light. Behind him, tall sunflowers sway rhythmically in the breeze, their petals glowing in the warm sunlight. The camera tilts upward to reveal a retro farmhouse with mint-green shutters, its walls dappled with shadows from swaying trees. Shot with a 35mm lens on Kodak Portra 400 film, the golden light creates rich textures on the farmer’s gloves, marmalade jar, and weathered wood of the beehives.(相機輕輕地漂浮在一排排粉彩畫的木製蜂箱中,嗡嗡作響的蜜蜂在畫面中滑進滑出。動作落在站在中間的優雅農民身上,他質樸的白色養蜂服在金色的午後陽光下閃閃發光。他舉起一罐蜂蜜,稍微傾斜以捕捉光線。在他身後,高大的向日葵在微風中有節奏地搖曳,花瓣在溫暖的陽光下閃閃發光。鏡頭向上傾斜,露出一座帶有薄荷綠色百葉窗的復古農舍,牆壁上佈滿了搖曳的樹木的陰影。使用 35 毫米鏡頭在柯達 Portra 400 膠片上拍攝,金色的光線在農民的手套、果醬罐和風化的蜂箱木材上創造出豐富的紋理。)
家人們,這一段影片,都能拿去做紀錄片以假亂真了吧!
除了人像,模擬真實物理世界也不在話下。
Prompt: The sun rises slowly behind a perfectly plated breakfast scene. Thick, golden maple syrup pours in slow motion over a stack of fluffy pancakes, each one releasing a soft, warm steam cloud. A close-up of crispy bacon sizzles, sending tiny embers of golden grease into the air. Coffee pours in smooth, swirling motion into a crystal-clear cup, filling it with deep brown layers of crema. Scene ends with a camera swoop into a fresh-cut orange, revealing its bright, juicy segments in stunning macro detail.(太陽在完美的早餐場景後面慢慢升起。厚厚的金色楓糖漿緩慢地倒在一堆鬆軟的煎餅上,每個煎餅都釋放出柔軟溫暖的蒸汽雲。脆皮培根的特寫鏡頭髮出嘶嘶聲,金色油脂的微小余燼飛散到空氣中。咖啡以平穩、旋轉的方式倒入水晶般透明的杯子中,充滿深棕色的咖啡油脂層。場景結束時,攝像機猛撲到剛切好的橙子中,以令人驚歎的宏觀細節展現出其明亮、多汁的部分。)
Prompt: A cinematic, high-action tracking shot follows an incredibly cute dachshund wearing swimming goggles as it leaps into a crystal-clear pool. The camera plunges underwater with the dog, capturing the joyful moment of submersion and the ensuing flurry of paddling with adorable little paws. Sunlight filters through the water, illuminating the dachshund's sleek, wet fur and highlighting the determined expression on its face. The shot is filled with the vibrant blues and greens of the pool water, creating a dynamic and visually stunning sequence that captures the pure joy and energy of the swimming dachshund.(電影般的高動作跟蹤鏡頭拍攝了一隻戴著泳鏡的極其可愛的臘腸犬跳進水晶般清澈的水池的畫面。相機與狗一起潛入水下,捕捉到浸入水中的快樂時刻以及隨後用可愛的小爪子划水的瞬間。陽光透過水麵,照亮了臘腸犬光滑溼潤的皮毛,凸顯了它臉上堅定的表情。這張照片充滿了池水充滿活力的藍色和綠色,創造了一個充滿活力和視覺震撼的序列,捕捉到了游泳的臘腸犬純粹的快樂和能量。)
A cinematic shot captures a fluffy Cockapoo, perched atop a vibrant pink flamingo float, in a sun-drenched Los Angeles swimming pool. The crystal-clear water sparkles under the bright California sun, reflecting the playful scene. The Cockapoo's fur, a soft blend of white and apricot, is highlighted by the golden sunlight, its floppy ears gently swaying in the breeze. Its happy expression and wagging tail convey pure joy and summer bliss. The vibrant pink flamingo adds a whimsical touch, creating a picture-perfect image of carefree fun in the LA sunshine.(在陽光普照的洛杉磯游泳池中,一個電影鏡頭捕捉到了一隻毛茸茸的可卡犬棲息在充滿活力的粉紅色火烈鳥浮標上。清澈見底的海水在加州燦爛的陽光下閃閃發光,倒映著嬉戲的景象。可卡犬的皮毛是白色和杏色的柔軟混合色,在金色的陽光下顯得更加突出,它鬆軟的耳朵在微風中輕輕搖曳。它快樂的表情和搖動的尾巴傳達著純粹的歡樂和夏日的幸福。充滿活力的粉紅色火烈鳥增添了一種異想天開的感覺,在洛杉磯的陽光下營造出一幅無憂無慮的完美畫面)
Prompt: A low-angle shot captures a flock of pink flamingos gracefully wading in a lush, tranquil lagoon. The vibrant pink of their plumage contrasts beautifully with the verdant green of the surrounding vegetation and the crystal-clear turquoise water. Sunlight glints off the water's surface, creating shimmering reflections that dance on the flamingos' feathers. The birds' elegant, curved necks are submerged as they walk through the shallow water, their movements creating gentle ripples that spread across the lagoon. The composition emphasizes the serenity and natural beauty of the scene, highlighting the delicate balance of the ecosystem and the inherent grace of these magnificent birds. The soft, diffused light of early morning bathes the entire scene in a warm, ethereal glow.(低角度拍攝捕捉到一群粉色火烈鳥在鬱鬱蔥蔥、寧靜的瀉湖中優雅地涉水。它們鮮亮的粉紅色羽毛與周圍翠綠的植被和晶瑩剔透的碧綠海水形成了美麗的對比。陽光在水面上閃閃發光,在火烈鳥的羽毛上產生閃爍的倒影。當它們穿過淺水時,它們優雅而彎曲的脖子被淹沒,它們的動作產生輕柔的漣漪,蔓延到整個瀉湖。構圖強調場景的寧靜和自然之美,突出生態系統的微妙平衡和這些宏偉鳥類與生俱來的優雅。清晨柔和、漫射的光線使整個場景沐浴在溫暖、空靈的光芒中。)
除了真實的場景,哪怕是“夢核”的內容,Veo 2 也能穩定駕馭:
Prompt: The camera spirals down through an infinite network of glowing threads, pulsating with multicolored light. The setting feels alive, each thread thrumming with faint whispers and bursts of imagery—fractals, mythological beasts, and celestial maps. The courier darts through the maze, their silhouette painted with the kaleidoscopic glow of the fibers. As they weave between strands, their every touch triggers animations—one a glowing phoenix, another a blooming lotus—until they stumble upon a massive, golden thread. It flares, and a holographic figure emerges: a younger version of themselves, surrounded by fiery glyphs. The scene shifts between soft, glowing pastels and brilliant, fiery tones, blending hand-drawn 2D animation with dynamic light effects, captured in fluid, sweeping motion.(攝像機螺旋向下穿過一個無限的發光線網路,閃爍著五彩的光芒。場景給人一種生機勃勃的感覺,每條線索都充滿了微弱的低語和影像的爆發——分形、神話野獸和天體圖。信使飛快地穿過迷宮,他們的輪廓被纖維的萬花筒般的光芒所描繪。當它們線上之間編織時,它們的每一次觸控都會觸發動畫——一個是發光的鳳凰,另一個是盛開的蓮花——直到他們偶然發現一根巨大的金線。它閃耀,一個全息人物出現:他們自己的年輕版本,周圍環繞著熾熱的符號。場景在柔和、發光的粉彩和絢麗、火熱的色調之間變換,將手繪的 2D 動畫與動態燈光效果融為一體,以流暢、掃過的動作捕捉。)
看完這些 showcase,筆者就第一時間衝到官網,打算實驗一下 Veo 2 是不是真的這麼牛——
結果,目前僅支援透過 VideoFX 平臺使用這個模型,並且想使用只能申請加入 waitlist!

申請地址:https://labs.google/fx/zh/tools/video-fx
介於 Veo 2 模型如此震撼的效果,之前實測 Sora 時,大家在評論區打出的“想看夕小瑤跳青海搖”,我打算直接用 Veo 2 滿足廣大小夥伴的願望。
現在筆者已經申請 waitlist 了,只要申請透過,就給大家帶來一手實測!(才不是因為我自己也想看跳青海搖是什麼效果——)

看完上述官方 demo 的小夥伴可能還有一個疑問:
誒它不是最長能生成 2 分鐘左右的影片嗎,怎麼每個官方演示影片都只有 8 秒?
這是因為目前 VideoFX 平臺上只能使用 Veo 2 閹割版,限制影片解析度上限為 720p,長度為 8 秒。
(即便是這樣,也比 20 美元套餐的 Sora 強啊)

DeepMind 產品副總裁 Eli Collins 表示,在接下來的幾個月中,他們將繼續根據使用者的反饋進行迭代,慢慢放出 Veo 2 完全體,並將 Veo 2 整合到整個 Google 生態系統中。預計明年會分享更多更新。
好吧,原來是一個期貨。
但谷歌的交付速度我是比較信任的,肯定不會像 Sora 一樣等了一年才放出來。
與 Veo 2 一起釋出的,還有一個文生圖模型 Imagen 3,生圖細節更好、光照更豐富、干擾更少。benchmark 得分就直接看圖吧。

這個模型生圖細節確實好到爆,現在就能直接使用,想體驗的小夥伴可以直接去下面的地址試一下。
Imagen 3 使用地址:https://labs.google/fx/tools/image-fx

谷歌現在放出的大招,跟 OpenAI 12 天直播的更新內容形成了鮮明對比——
谷歌每次出現就是核彈級別,Gemini 2.0,還有這次的 Veo 2,搶盡了 OpenAI 的風頭。
OpenAI 這邊就是純粹的炒作過度了,預告 12 天直播給大家勾起了興趣,現在又一直給大家潑冷水。
不知道 Sam Altman 看到谷歌這次的更新後,還能不能睡得著覺。



參考資料:
https://blog.google/technology/google-labs/video-image-generation-update-december-2024/
https://techcrunch.com/2024/12/16/google-deepmind-unveils-a-new-video-model-to-rival-sora/
https://x.com/agrimgupta92/status/1868745017571131582