為什麼體操運動是AI影片的噩夢?|亮馬橋小紀嚴選

小紀有話說:
12月10日Sora全網上線,大家也都測試了很多了。坦率地講,產品完成度很高,但是模型質量,真的有點不及預期。
不過今天不是來聊Sora模型的,而是聊聊昨天測試Sora時生成的一段體操影片。
在前面5秒,她蓄勢抬手的時候,一切都還能看。直到真的想做動作時,一切都變得鬼畜了起來。畫面瞬間崩塌,甚至跟異形無異。
體操,好像永遠都是所有AI影片的噩夢。不管是Sora、Luma,還是可靈、Runway等等,在生成體操影片時都會翻車。有的翻車翻得比較溫柔,因為他們動作幅度小。
有的翻車翻得比較大,直接讓運動員在空中扭曲變形。

體操運動,就是AI影片最殘酷的圖靈測試。當年大家都在用威爾・史密斯吃麵來衡量AI影片,但其實,體操才是真正的那個門神。
本文轉載自
公眾號“環球科學”(id:huanqiukexue)
五個月前,DiT影片模型剛剛出來的時候,一段Luma生成的體操影片在X上就引發軒然大波。
影片裡面,運動員的四肢在空中扭曲變形。這段由Luma生成的影片不僅讓近百萬網友圍觀,還讓包括LeCun在內的AI大佬們吵得不可開交。
爭論的焦點只有一個:AI到底理解不理解物理規律?
如今5個月過去,現在這個問題,幾乎已經有了共識。
物理規律,那肯定是不懂的。
回到體操運動,為啥人的跑步、走路等動作現在幾乎很好,很多動物的也很穩定,但一旦涉及到複雜動作,特別是體操這種,就直接炸了呢?
其實也挺簡單的。
首先,我們得聊聊體操運動有多難。
一個標準的體操動作,比如後空翻加轉體720度,看起來只有短短兩秒鐘,但這兩秒鐘裡,有大概三重對於AI來說非常地獄的難點。
第一個是物理難點。
不同於走路奔跑這些幾乎刻在基因裡面的動作。
體操運動,是要在一瞬間爆發出足夠的力量起跳,在空中完成兩週旋轉,然後穩穩落地。
這個過程中涉及了重力、慣性、角動量守恆等多個物理定律。坦率地講,起跳角度差1度、力量差一分,你可能最後都是落地不穩。
在現實世界中,一個體操運動員要經過至少十年的訓練,才能把這些刻在記憶裡、刻在肌肉裡。而AI要在短短的訓練過程中領悟這些規律,難度可想而知。
第二個是生物力學難點。
人的身體結構極其複雜,206塊骨頭、超過600塊肌肉。
每一塊骨頭和肌肉,都有自己的運動軌跡和配合。
對於人類來說,這種配合是與生俱來的本能。但對AI來說,理解這種複雜的生物力學系統卻是一個巨大的挑戰。
就像在AI繪畫時經常會畫出六根手指的人一樣,AI在生成一些複雜動作時,也經常會在生物力學層面犯下很多致命錯誤。比如肘關節反向彎曲、膝蓋過度旋轉等等,還有最經典的,轉身是真的只轉身不轉頭……
這些錯誤之所以會發生,是因為AI並不真正理解人體的構造限制。它不知道人的關節只能在特定角度活動,不懂得肌肉群之間的協同關係,更不理解人體在高速運動時的生物力學特性。
更重要的是,AI不理解“疼痛”這個概念。在現實中,疼痛是人體對不合理動作的自然反饋,是保護機制的一部分。但AI生成的動作中,可不管你痛不痛,能動就行。
這就好比讓一個對人體結構一無所知的畫家,閉著眼睛畫一個體操運動員的動作連續圖。他可能會畫出看似流暢,實則完全違揹人體工程學的畫面。
而這種生物力學上的侷限性,恰恰是AI在生成體操影片時最難突破的瓶頸之一。
第三個點則是美學難點。
體操不是純粹的體育競技,更是一門藝術。
動作的優美程度、身體的線條感、整體的韻律美,都是體操比賽中的重要評分標準。一個動作即使完成了技術動作,如果缺乏美感,一樣會被扣分。
動作要準,還要優美,這對AI來說,太難了。
而這三重難度疊加在一起,就成了AI的噩夢。
有人說AI生成體操影片失敗是因為訓練資料不足,有人說是資料集模糊處理導致模型無法理解人體結構。
但更深層的問題我覺得還是在於:AI終究還是在完美模仿。
就像一隻鸚鵡再怎麼會模仿人類說話,它也不知道它所說的話是什麼意思,哪怕它對答如流。
這個比喻非常精準。
我覺得對現在的大模型如此、對AI繪圖如此,對AI影片,更是如此。
當AI生成影片時,它實際上是在進行一場機率遊戲,根據已經見過的畫面去猜測下一幀最可能是什麼樣子。這就像是一個從沒學過體操的人,在試圖透過看過的影片去復現一個高難度動作。
但體操不是機率遊戲。
一些比較前沿的學術界,也嘗試引入物理引擎模擬(比如將動作生成與物理模擬器結合),或者在損失函式中加入物理規律約束,但還都在探索階段,離所謂的世界模擬器,還差太遠太遠了。
就像圖靈測試用人類對話來檢驗AI的智慧水平,體操影片我覺得就是在考驗AI對現實世界的理解深度。它需要AI不僅能“完美模仿”,更要理解背後的物理規律、生物力學原理和美學標準。
這種理解,遠比我們想象的要深刻得多。
恰恰印證了Pedro Domingos教授的判斷。通往AGI的路,也許比我們想象的還要遠一些。
這條路或許很遠。
但終點一定值得期待。
*作者:卡茲克,本文經授權轉載自數字生命卡茲克(ID:Rockhazix),如需二次轉載請聯絡原作者。歡迎轉發到朋友圈。頭圖及封面圖來源於“周鎣”。
溫馨提示:雖然我們每天都有推送,但最近有讀者表示因平臺推送規則調整,有時候看不到我們的文章~
歡迎大家進入公眾號頁面,右上角點選“設為星標”點亮⭐️,收藏我們的公眾號,新鮮內容第一時間奉上!
*文章觀點僅供參考,不代表本機構立場


相關文章