AI影片生成告別默劇時代!谷歌Veo3一步生成高質量音畫大片,rap、電影、動畫片都拿捏

文章轉載於量子位(QbitAI)
作者:一水
谷歌最強影片生成模型Veo 3鯊瘋了!
這一次,從畫面到對白,全都由AI原生直接生成。
不僅可以拿捏各種影視風格——
請看VCR(花式演繹“We can talk!”)
還能搞定大段rap——
影片中的Flow只需簡單一句話就能搞定,比如“讓老人談論宇宙”。
從畫面到口型再到音訊,完全以假亂真了。
還在釋出會現場,谷歌DeepMind CEO哈薩比斯就激動宣佈:
我們終於走出了無聲影片生成的時代。現在使用者能用自然語言直接描述角色、場景,還能指定對白和語氣。
而透過官方demo,我們也看到了Veo 3電影級的音影片能力:
目前Veo 3已在Gemini應用程式中面向Google AI Ultra訂閱使用者開放,企業使用者可以在Vertex AI平臺呼叫。
雖然距離釋出會結束才幾小時,但一大波網友試玩已新鮮出爐——
1
說唱、洗腦神曲、烹飪節目花式整活
一上來,腦洞大開的網友們就開始搞起了抽象……
提示詞:a video with dialogue of two muffins while baking in an over, the first muffin says “I can’t believe this Veo 3 thing can do dialogue now!”, the second muffin says “AAAAH, a talking muffin!”
兩個鬆餅表情豐富地開始了對話,連口型都能完美對上:
還復古了上世紀80年代的烹飪節目,並帶來全新互動方式:
提示詞(中譯版):一段20世紀80年代復古電視烹飪節目的影片,主持人是一位65歲左右的英國老太太。她正把麵糰放在面前的檯面上擀著,說道:“現在,這得費點勁兒……”然後,麵糰變成了一張臉,抬頭看著她,用布魯克林口音說道:“嘿,女士,看著點!我正在努力膨脹。” VHS錄影帶中的噪音
雖然最後一句話本該是麵糰的臺詞(未完全遵照提示),但製作該影片的網友仍然被效果驚到了。
還有我們熟悉的洗腦神曲,連彈舌這種技術活兒都不在話下。(⊙o⊙)
提示詞:futuristic russian singer, techo vibes, eclectic tongue thing.
當然,除了這些好玩的,更有古希臘數學家畢達哥拉斯開展新式教學(連小蜜蜂都有)
提示詞:Pythagoras explaining his theorem, in ancient Greece
也能直接用來花式營銷,一遍又一遍強調同一個概念,主打一個洗腦。
有網友激動表示,再這樣下去Veo 4就和真的沒啥區別了。
而另一邊,谷歌首席創意技術專家也透露了一些玩法細節。
他測試了一把Veo 3連續生成長影片的能力。
使用首尾幀功能,他最終制作了下面這個1分鐘左右的影片:
雖然這裡的背景音樂不是由Veo 3生成的,但男主角的自白和各種音效確實有電影內味兒了。
1
One More Thing
與此同時,谷歌Veo 2也迎來了升級。
最大亮點在於新增了“參考影片”功能,用來保持影片風格統一以及角色形象一致。
還有相機控制、首尾幀、畫面擴充套件、物體新增/移除等其他功能。
這些新功能目前已在Flow工具中部分上線,完整版很快將在Vertex AI平臺推出。
最後,你認為谷歌這次的影片AI表現如何呢?
參考連結:[1]https://x.com/arikuschnir/status/1924953349943697763[2]https://x.com/MartinNebelong/status/1924926779677905014[3]https://x.com/AIForHumansShow/status/1924934882930917861[4]https://x.com/nearcyan/status/1924963340876710365[5]https://x.com/skirano/status/1924957061969834382

點個愛心,再走


相關文章