

小紀有話說:


本文轉載自
公眾號“環球科學”(id:huanqiukexue)
五個月前,DiT影片模型剛剛出來的時候,一段Luma生成的體操影片在X上就引發軒然大波。

影片裡面,運動員的四肢在空中扭曲變形。這段由Luma生成的影片不僅讓近百萬網友圍觀,還讓包括LeCun在內的AI大佬們吵得不可開交。
爭論的焦點只有一個:AI到底理解不理解物理規律?
如今5個月過去,現在這個問題,幾乎已經有了共識。
物理規律,那肯定是不懂的。
回到體操運動,為啥人的跑步、走路等動作現在幾乎很好,很多動物的也很穩定,但一旦涉及到複雜動作,特別是體操這種,就直接炸了呢?
其實也挺簡單的。
首先,我們得聊聊體操運動有多難。
一個標準的體操動作,比如後空翻加轉體720度,看起來只有短短兩秒鐘,但這兩秒鐘裡,有大概三重對於AI來說非常地獄的難點。
第一個是物理難點。
不同於走路奔跑這些幾乎刻在基因裡面的動作。
體操運動,是要在一瞬間爆發出足夠的力量起跳,在空中完成兩週旋轉,然後穩穩落地。
這個過程中涉及了重力、慣性、角動量守恆等多個物理定律。坦率地講,起跳角度差1度、力量差一分,你可能最後都是落地不穩。
在現實世界中,一個體操運動員要經過至少十年的訓練,才能把這些刻在記憶裡、刻在肌肉裡。而AI要在短短的訓練過程中領悟這些規律,難度可想而知。
第二個是生物力學難點。
人的身體結構極其複雜,206塊骨頭、超過600塊肌肉。
每一塊骨頭和肌肉,都有自己的運動軌跡和配合。
對於人類來說,這種配合是與生俱來的本能。但對AI來說,理解這種複雜的生物力學系統卻是一個巨大的挑戰。
就像在AI繪畫時經常會畫出六根手指的人一樣,AI在生成一些複雜動作時,也經常會在生物力學層面犯下很多致命錯誤。比如肘關節反向彎曲、膝蓋過度旋轉等等,還有最經典的,轉身是真的只轉身不轉頭……




