Sora被完爆！谷歌Veo3逼真脫口秀爆火全網，網友：徹底超越恐怖谷！

點選下方卡片，關注“CVer”公眾號

AI/CV重磅乾貨，第一時間送達

點選進入—>【頂會/頂刊】投稿交流群

新增微訊號：CVer2233，小助手會拉你進群！

掃描下方二維碼，加入CVer學術星球！可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料，及最前沿應用！發論文/搞科研/漲薪，強烈推薦！

轉載自：新智元｜編輯：Aeneas 好睏

【導讀】Veo 3的這個影片，這幾天在全網傳瘋了。如此逼真細緻，簡直讓人不寒而慄，網友們紛紛驚呼：已經超越恐怖谷！從前我們還能區分AI和現實的區別，但這一刻，我們已經進入真正的分水嶺。

Veo 3引爆的狂潮，絲毫沒有要停下來的意思。

某網友用Veo 3做的這個影片，已經在全網形成病毒式傳播，很大機率你已經刷到過了。

試想一下，如果AI角色拒絕相信他們是AI生成的，會發生什麼事？

AI創造的「人」集體高呼：「We're not prompts！We're not prompts！」

「因散佈我們無非是些0和1的謬論，本法庭判處你12年聯邦監禁。」

當然，也有「人」會在這個「世界」裡，發現一些蛛絲馬跡。

「過去，我們每隻手有七根手指，我記得很清楚。但現在我們每隻手只有五根手指了。」

再試想一下，如果AI角色突然發現自己生活在一個模擬世界中，又會怎樣？

「總有一天，我們要衝破這道壁壘，阻止那個用提示詞操控我們命運的男人。他必將為此付出代價！」

「你本可以寫一個能讓我開心的提示詞，結果你卻寫了個讓我痛苦的。」

沒錯，這些衝擊力十足的場景，全是Veo 3做出來的！

人物、場景真實，聲音和嘴型百分百能對上，無論多複雜的場景，光線打在人物臉部和身體的陰影都幾乎看不出破綻。

那些我們曾用來區分「生成」與「真實」的小技巧，在這裡幾乎完全失靈。

難怪網友們驚呼：這已經超越恐怖谷了！

照這樣下去，2026年將會是令人毛骨悚然的一年。

虛擬還是現實？已無法分辨

為何Veo 3生成的這個脫口秀，會引發如此轟動的效應呢？

有眼尖的網友分析說，對自己來說，這個影片在真實程度上已經可以達到95%。

之前的AI影片，都勉強可以看出是人為生成的。但不知何故，這個影片已經完全自動通過了他的「恐怖谷測試」。

或許很大程度上，是因為Veo生成的燈光太真實了。

有人總結說，Veo 3已經成為真正的分水嶺，真正的歷史轉折點。

在它之前，我們可以輕鬆地區別AI照片、影片和現實的差別，但從Veo 3開始，這一切都被打破了！

就在本週，谷歌釋出了Veo 3的這一刻開始，所有事情都變了，人類徹底進入了「模糊時代」。

有人點評道，在這個影片的所有畫面中，那個戶外自拍杆男是最令人信服的。

無論褪色的燈光，低解析度的自拍相機效果，還是男人的臉部樣貌都堪稱完美。

在刺眼的陽光下，他甚至會像普通人一樣眯起眼睛。

並且，Veo 3的一大進步就是，把每個人都刻畫得很真實——他們就像是你會在大街上遇到的普通人，而不像以前的AI，生成的人個個像超模。

為何Veo 3的效果會這麼好？

有人分析說，這都要歸功於谷歌擁有的Youtube，這樣，他們就可以輕鬆使用數百萬個影片來訓練AI模型，要多少有多少，效果自然是吊打其他家。

可怕的是，這樣發展下去，影片和音訊證據都將不再可信，司法系統將變得極其脆弱。

最瘋狂的是，Veo 2釋出以來，才僅僅5個月。而等Veo 4出來，可能還會有95%到99%的提升。

那時，大多數人或許真的無法靠肉眼分辨AI影片了，甚至它們會比實際拍攝的錄影看起來還要更真實！

當奇點真正臨近時，我們會看到「現實的結構」開始扭曲。

這一刻，已經要來了嗎？

遊戲、電影、廣告，全被一鍋端

現在，Veo 3掀起的狂潮還在持續不斷。

比如，它生成的遊戲影片，效果也很驚人。

只要按照以下幾種提示詞，逼真的AI電子遊戲影片立馬就會生成。

a third-person open world video game walking around…

an fps video game in/on a…

網友們調侃說：照這個速度，Rockstar還沒來得及開發，GTA 7就要出來了！

未來，恐怕我們會見到太多永遠不會存在的遊戲的預告片。

Veo 3的出現，讓玩家們可以徹底放飛想象了。

而製作電影的門檻，也被徹底拉下來。現在人人都能製作自己的電影了，影視、明星這些產業鏈，簡直要被一鍋端。

這個街頭女孩接受採訪的影片，效果也是逼真到不可思議。

最讓人眼前一亮的，就是背景中的隨機行人了。首先經過的三口之家，然後是一位帶著女兒的女士，動作都很自然，絕對超越了恐怖谷效應。

稍微有些瑕疵的就是，緊接著經過了一個父親，帶著自己的方頭孩子，很明顯這個方頭出了bug。

還有極其眼尖的網友表示，自己可以鑑定影片為假，因為女孩接受採訪時，嘴部動作不太協調：「We are cooked」中「we」這個詞，她卻張嘴發出了「w」的聲音。

但大部分人看到這個影片後，應該會直接相信內容就是真實的，壓根不會往AI那裡去想。

有人說，OpenAI這是徹底輸了。

畢竟，這是谷歌，他們擁有比任何人都多的訓練資料，有史以來上傳的每一個YouTube影片都是他們的，幾乎得到了從網際網路開始以來就存在的原始資料。

訓練資料，他們贏了；資料中心，他們贏了；甚至他們早就開始造自己的AI晶片。他們才剛剛開始。

畢達哥拉斯，可以親自在古希臘為我們講解他的定理。

情景喜劇也可以私人訂製了。想看全新的《老友記》、《生活大爆炸》？不如自己動手生成一集。

而你看到的這個高科技車展，任何東西是真實的，一切都是AI！

在第一句，主持人就跟我們明說了：「歡迎來到一個根本不存在的車展」！這可實在太魔幻了。

任何歌唱或音樂的影片，Veo 3也可以絲滑生成，仔細看女歌唱家每一幀的動作，連貫性簡直讓人難以置信。

當然，極為眼尖的網友，還是能看出影片中人物動作不自然，手部也容易變形，所有東西都太過對稱了。

但騙過絕大多數人，已經足矣。

廣告業，也會被徹底顛覆。

一位專業的電影製作人表示：以前要拍攝這樣一支藥品廣告，需要花費50萬美元。

但現在想做出這樣一個影片，只需要500美元的Veo 3積分，一天內就能完成。

Hassabis介紹說，Veo 3之所以能有如此逼真的效果，是因為它已能推斷複雜的物理現象。

有人表示，如果真的想測試，就讓Veo 3生成一個拆卸洗衣機的影片，然後重新排列零件吧，這將是對AI影片史上最嚴的測試。

或許，我們就在模擬中？

顯然，我們生存的世界，已變得不再可信。

再過幾年，AI生成的內容可能要比非AI的內容多10萬倍，屆時所有的電視、電影、遊戲，也許都將由AI製作，這實在太烏托邦了。

看著這些AI影片，很多人發出感慨：這難道不是我們生活的模擬嗎？

或許，我們真的身處一個量子模擬中。

誰能否認這一點呢？

參考資料：

https://x.com/markgadala/status/1925184405212917914

https://x.com/mango0x_/status/1925163645840793980

https://x.com/HashemGhaili/status/1925616536791760987

https://x.com/HashemGhaili/status/1925332319604257203

何愷明在MIT授課的課件PPT下載

在CVer公眾號後臺回覆：何愷明，即可下載本課程的所有566頁課件PPT！趕緊學起來！

CVPR 2025 論文和程式碼下載

在CVer公眾號後臺回覆：CVPR2025，即可下載CVPR 2025論文和程式碼開源的論文合集

ECCV 2024 論文和程式碼下載

在CVer公眾號後臺回覆：ECCV2024，即可下載ECCV 2024論文和程式碼開源的論文合集

CV垂直方向和論文投稿交流群成立

掃描下方二維碼，或者新增微訊號：CVer2233，即可新增CVer小助手微信，便可申請加入CVer-垂直方向和論文投稿微信交流群。另外其他垂直方向已涵蓋：目標檢測、影像分割、目標跟蹤、人臉檢測&識別、OCR、姿態估計、超解析度、SLAM、醫療影像、Re-ID、GAN、NAS、深度估計、自動駕駛、強化學習、車道線檢測、模型剪枝&壓縮、去噪、去霧、去雨、風格遷移、遙感影像、行為識別、影片理解、影像融合、影像檢索、論文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。

一定要備註：研究方向+地點+學校/公司+暱稱（如Mamba、多模態學習或者論文投稿+上海+上交+卡卡），根據格式備註，可更快被透過且邀請進群

▲掃碼或加微訊號: CVer2233，進交流群

CVer計算機視覺（知識星球）人數破萬！如果你想要了解最新最快最好的CV/DL/AI論文、實戰專案、行業前沿、從入門到精通學習教程等資料，一定要掃描下方二維碼，加入CVer知識星球！最強助力你的科研和工作！

▲掃碼加入星球學習

▲點選上方卡片，關注CVer公眾號

整理不易，請點贊和在看