AI影片生成告別默劇時代！谷歌Veo3一步生成高質量音畫大片，rap、電影、動畫片都拿捏

文章轉載於量子位（QbitAI）

作者：一水

谷歌最強影片生成模型Veo 3鯊瘋了！

這一次，從畫面到對白，全都由AI原生直接生成。

不僅可以拿捏各種影視風格——

請看VCR（花式演繹“We can talk！”）。

還能搞定大段rap——

影片中的Flow只需簡單一句話就能搞定，比如“讓老人談論宇宙”。

從畫面到口型再到音訊，完全以假亂真了。

還在釋出會現場，谷歌DeepMind CEO哈薩比斯就激動宣佈：

我們終於走出了無聲影片生成的時代。現在使用者能用自然語言直接描述角色、場景，還能指定對白和語氣。

而透過官方demo，我們也看到了Veo 3電影級的音影片能力：

目前Veo 3已在Gemini應用程式中面向Google AI Ultra訂閱使用者開放，企業使用者可以在Vertex AI平臺呼叫。

雖然距離釋出會結束才幾小時，但一大波網友試玩已新鮮出爐——

說唱、洗腦神曲、烹飪節目花式整活

一上來，腦洞大開的網友們就開始搞起了抽象……

提示詞：a video with dialogue of two muffins while baking in an over, the first muffin says “I can’t believe this Veo 3 thing can do dialogue now!”, the second muffin says “AAAAH, a talking muffin!”

兩個鬆餅表情豐富地開始了對話，連口型都能完美對上：

還復古了上世紀80年代的烹飪節目，並帶來全新互動方式：

提示詞（中譯版）：一段20世紀80年代復古電視烹飪節目的影片，主持人是一位65歲左右的英國老太太。她正把麵糰放在面前的檯面上擀著，說道：“現在，這得費點勁兒……”然後，麵糰變成了一張臉，抬頭看著她，用布魯克林口音說道：“嘿，女士，看著點！我正在努力膨脹。” VHS錄影帶中的噪音

雖然最後一句話本該是麵糰的臺詞（未完全遵照提示），但製作該影片的網友仍然被效果驚到了。

還有我們熟悉的洗腦神曲，連彈舌這種技術活兒都不在話下。(⊙o⊙)

提示詞：futuristic russian singer, techo vibes, eclectic tongue thing.

當然，除了這些好玩的，更有古希臘數學家畢達哥拉斯開展新式教學（連小蜜蜂都有）。

提示詞：Pythagoras explaining his theorem, in ancient Greece

也能直接用來花式營銷，一遍又一遍強調同一個概念，主打一個洗腦。

有網友激動表示，再這樣下去Veo 4就和真的沒啥區別了。

而另一邊，谷歌首席創意技術專家也透露了一些玩法細節。

他測試了一把Veo 3連續生成長影片的能力。

使用首尾幀功能，他最終制作了下面這個1分鐘左右的影片：

雖然這裡的背景音樂不是由Veo 3生成的，但男主角的自白和各種音效確實有電影內味兒了。

One More Thing

與此同時，谷歌Veo 2也迎來了升級。

最大亮點在於新增了“參考影片”功能，用來保持影片風格統一以及角色形象一致。

還有相機控制、首尾幀、畫面擴充套件、物體新增/移除等其他功能。

這些新功能目前已在Flow工具中部分上線，完整版很快將在Vertex AI平臺推出。

最後，你認為谷歌這次的影片AI表現如何呢？

參考連結：[1]https://x.com/arikuschnir/status/1924953349943697763[2]https://x.com/MartinNebelong/status/1924926779677905014[3]https://x.com/AIForHumansShow/status/1924934882930917861[4]https://x.com/nearcyan/status/1924963340876710365[5]https://x.com/skirano/status/1924957061969834382