點選下方卡片,關注“CVer”公眾號
AI/CV重磅乾貨,第一時間送達
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!
轉載自:新智元 |編輯:Aeneas 好睏
AI/CV重磅乾貨,第一時間送達
AI/CV重磅乾貨,第一時間送達
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!

【導讀】Veo 3的這個影片,這幾天在全網傳瘋了。如此逼真細緻,簡直讓人不寒而慄,網友們紛紛驚呼:已經超越恐怖谷!從前我們還能區分AI和現實的區別,但這一刻,我們已經進入真正的分水嶺。
Veo 3引爆的狂潮,絲毫沒有要停下來的意思。
某網友用Veo 3做的這個影片,已經在全網形成病毒式傳播,很大機率你已經刷到過了。
試想一下,如果AI角色拒絕相信他們是AI生成的,會發生什麼事?
AI創造的「人」集體高呼:「We're not prompts!We're not prompts!」

「因散佈我們無非是些0和1的謬論,本法庭判處你12年聯邦監禁。」

當然,也有「人」會在這個「世界」裡,發現一些蛛絲馬跡。
「過去,我們每隻手有七根手指,我記得很清楚。但現在我們每隻手只有五根手指了。」

再試想一下,如果AI角色突然發現自己生活在一個模擬世界中,又會怎樣?
「總有一天,我們要衝破這道壁壘,阻止那個用提示詞操控我們命運的男人。他必將為此付出代價!」

「你本可以寫一個能讓我開心的提示詞,結果你卻寫了個讓我痛苦的。」

沒錯,這些衝擊力十足的場景,全是Veo 3做出來的!
![]() |
![]() |
人物、場景真實,聲音和嘴型百分百能對上,無論多複雜的場景,光線打在人物臉部和身體的陰影都幾乎看不出破綻。
那些我們曾用來區分「生成」與「真實」的小技巧,在這裡幾乎完全失靈。
難怪網友們驚呼:這已經超越恐怖谷了!

照這樣下去,2026年將會是令人毛骨悚然的一年。

虛擬還是現實?已無法分辨
為何Veo 3生成的這個脫口秀,會引發如此轟動的效應呢?
有眼尖的網友分析說,對自己來說,這個影片在真實程度上已經可以達到95%。
之前的AI影片,都勉強可以看出是人為生成的。但不知何故,這個影片已經完全自動通過了他的「恐怖谷測試」。
或許很大程度上,是因為Veo生成的燈光太真實了。

有人總結說,Veo 3已經成為真正的分水嶺,真正的歷史轉折點。
在它之前,我們可以輕鬆地區別AI照片、影片和現實的差別,但從Veo 3開始,這一切都被打破了!
就在本週,谷歌釋出了Veo 3的這一刻開始,所有事情都變了,人類徹底進入了「模糊時代」。

有人點評道,在這個影片的所有畫面中,那個戶外自拍杆男是最令人信服的。

無論褪色的燈光,低解析度的自拍相機效果,還是男人的臉部樣貌都堪稱完美。
在刺眼的陽光下,他甚至會像普通人一樣眯起眼睛。
並且,Veo 3的一大進步就是,把每個人都刻畫得很真實——他們就像是你會在大街上遇到的普通人,而不像以前的AI,生成的人個個像超模。

為何Veo 3的效果會這麼好?
有人分析說,這都要歸功於谷歌擁有的Youtube,這樣,他們就可以輕鬆使用數百萬個影片來訓練AI模型,要多少有多少,效果自然是吊打其他家。
可怕的是,這樣發展下去,影片和音訊證據都將不再可信,司法系統將變得極其脆弱。

最瘋狂的是,Veo 2釋出以來,才僅僅5個月。而等Veo 4出來,可能還會有95%到99%的提升。
那時,大多數人或許真的無法靠肉眼分辨AI影片了,甚至它們會比實際拍攝的錄影看起來還要更真實!

當奇點真正臨近時,我們會看到「現實的結構」開始扭曲。
這一刻,已經要來了嗎?

遊戲、電影、廣告,全被一鍋端
現在,Veo 3掀起的狂潮還在持續不斷。
比如,它生成的遊戲影片,效果也很驚人。
只要按照以下幾種提示詞,逼真的AI電子遊戲影片立馬就會生成。
a third-person open world video game walking around…
an fps video game in/on a…
網友們調侃說:照這個速度,Rockstar還沒來得及開發,GTA 7就要出來了!
未來,恐怕我們會見到太多永遠不會存在的遊戲的預告片。
Veo 3的出現,讓玩家們可以徹底放飛想象了。


而製作電影的門檻,也被徹底拉下來。現在人人都能製作自己的電影了,影視、明星這些產業鏈,簡直要被一鍋端。
這個街頭女孩接受採訪的影片,效果也是逼真到不可思議。
最讓人眼前一亮的,就是背景中的隨機行人了。首先經過的三口之家,然後是一位帶著女兒的女士,動作都很自然,絕對超越了恐怖谷效應。
稍微有些瑕疵的就是,緊接著經過了一個父親,帶著自己的方頭孩子,很明顯這個方頭出了bug。
還有極其眼尖的網友表示,自己可以鑑定影片為假,因為女孩接受採訪時,嘴部動作不太協調:「We are cooked」中「we」這個詞,她卻張嘴發出了「w」的聲音。

但大部分人看到這個影片後,應該會直接相信內容就是真實的,壓根不會往AI那裡去想。
有人說,OpenAI這是徹底輸了。
畢竟,這是谷歌,他們擁有比任何人都多的訓練資料,有史以來上傳的每一個YouTube影片都是他們的,幾乎得到了從網際網路開始以來就存在的原始資料。
訓練資料,他們贏了;資料中心,他們贏了;甚至他們早就開始造自己的AI晶片。他們才剛剛開始。

畢達哥拉斯,可以親自在古希臘為我們講解他的定理。
情景喜劇也可以私人訂製了。想看全新的《老友記》、《生活大爆炸》?不如自己動手生成一集。
而你看到的這個高科技車展,任何東西是真實的,一切都是AI!

在第一句,主持人就跟我們明說了:「歡迎來到一個根本不存在的車展」!這可實在太魔幻了。
任何歌唱或音樂的影片,Veo 3也可以絲滑生成,仔細看女歌唱家每一幀的動作,連貫性簡直讓人難以置信。
當然,極為眼尖的網友,還是能看出影片中人物動作不自然,手部也容易變形,所有東西都太過對稱了。
但騙過絕大多數人,已經足矣。

廣告業,也會被徹底顛覆。
一位專業的電影製作人表示:以前要拍攝這樣一支藥品廣告,需要花費50萬美元。


但現在想做出這樣一個影片,只需要500美元的Veo 3積分,一天內就能完成。

Hassabis介紹說,Veo 3之所以能有如此逼真的效果,是因為它已能推斷複雜的物理現象。

有人表示,如果真的想測試,就讓Veo 3生成一個拆卸洗衣機的影片,然後重新排列零件吧,這將是對AI影片史上最嚴的測試。



或許,我們就在模擬中?
顯然,我們生存的世界,已變得不再可信。

再過幾年,AI生成的內容可能要比非AI的內容多10萬倍,屆時所有的電視、電影、遊戲,也許都將由AI製作,這實在太烏托邦了。

看著這些AI影片,很多人發出感慨:這難道不是我們生活的模擬嗎?
或許,我們真的身處一個量子模擬中。
誰能否認這一點呢?

參考資料:
https://x.com/markgadala/status/1925184405212917914
https://x.com/mango0x_/status/1925163645840793980
https://x.com/HashemGhaili/status/1925616536791760987
https://x.com/HashemGhaili/status/1925332319604257203
CVPR 2025 論文和程式碼下載
CVPR 2025 論文和程式碼下載
ECCV 2024 論文和程式碼下載
ECCV 2024 論文和程式碼下載
CV垂直方向和論文投稿交流群成立
一定要備註:研究方向+地點+學校/公司+暱稱(如Mamba、多模態學習或者論文投稿+上海+上交+卡卡),根據格式備註,可更快被透過且邀請進群
▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)人數破萬!如果你想要了解最新最快最好的CV/DL/AI論文、實戰專案、行業前沿、從入門到精通學習教程等資料,一定要掃描下方二維碼,加入CVer知識星球!最強助力你的科研和工作!
▲掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看

▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)人數破萬!如果你想要了解最新最快最好的CV/DL/AI論文、實戰專案、行業前沿、從入門到精通學習教程等資料,一定要掃描下方二維碼,加入CVer知識星球!最強助力你的科研和工作!

▲掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看
