

一個好訊息,可靈AI這次來了波大的。
就在今天下午,快手上線了可靈2.0影片生成模型和可圖2.0影像生成模型,全量開放,進他們家官網就能用。
一上來,快手的高階副總裁蓋坤就直接擺資料,可靈2.0的文生影片模型甩了Veo2和Sora好幾個車尾燈,圖生影片也要比Runway的新模型Gen-4強不少。

甚至還在現場放話,把可靈2.0稱作是“世界上最強大的視覺生成模型”。
雖說世超沒去釋出會現場,但結合官方放出來的demo、網友的測試,當然還有我們自己的一手體驗,咱不敢打包票可靈2.0是最強的,但實力的確對得起現階段“AI影片版本答案”這個稱號。

這次升級比較出色的一個點,
就是動態質量上的最佳化。可靈AI官方 po 出來的案例,那效果可以說是非常驚豔了,隨便拎出一個來,都可以稱得上是百萬鏡頭、千億製作。
就比如這個,穿著長袍的人在漫天黃沙中行走,你別說,還真有點電影《沙丘》那味兒了。

可靈2.0釋出後的第一時間,X上也有不少網友把自己的case發了出來。
拿已經生成好的圖片,讓可靈2.0跑一個災難片場景。短短5秒的時間,可靈2.0把男人整體逃跑的動作流暢地表現了出來。

當然瑕疵也是有的,空中散落的傳單大部分都糊掉了。
直接拿同一組prompt分別測試了可靈2.0和可靈1.6的效果。
就比如這個少女騎著海上摩托艇送外賣的影片,可以看到,可靈2.0對海上摩托艇的動態處理更逼真,不再是千篇一律的慢動作,發動機對於海浪的衝擊是在變化的,反觀可靈1.6的摩托艇,穩得有點太假了。。。


還有一個圖片生成的影片,提示詞是“她很生氣”,可靈2.0和1.6的表現力高下立判。

前者的面部表情很生動,把對“生氣”的理解變成了破口大罵,後者的“生氣”,有點猜不出到底是生氣還是無語。

看下來,大夥兒對可靈2.0的評價都還挺正向的,唯一的一點吐槽,可能就是價格真的有一點貴。。。

用可靈2.0生成一個5秒的影片,要花掉100積分,也就是10塊錢。世超也只能用兜裡僅剩的幾十塊錢,給大夥兒淺淺測評一波。
在動態效果上,我用可圖2.0生成的地下室忍者圖片,跑了一個模擬被忍者追殺的鏡頭。
prompt是這樣的:忍者做完一個前空翻之後,舉起手中的武器衝向鏡頭,鏡頭不斷後移,隨著地下室場景的變化,光線越來越暗。
半小時的等待時間裡,我把同一組prompt餵給了可靈1.6。

1.6快是快了,但質量得打對摺。說好的前空翻呢,往下蹲這一下算怎麼回事??
再來看可靈2.0的結果,相比之下要順眼多了。
雖說前空翻的動作一整個糊掉了,但好歹動作完成度是有的,舉起手中的武器衝向鏡頭也理解得沒毛病。在語義響應方面,做得確實還不錯。

不過老實說,這個影片的動態效果沒有我想象中的那麼好,特別是在畫面穩定性上,明顯能看到手部、武器變形的地方。
再來看這個例子(prompt:擁擠的車流中,一隻機器狗往前狂奔,鏡頭慢慢往右移動到機器狗的側面,到達十字路口的時候,機器狗起跳,越過了一輛汽車,而後繼續向前狂奔)
別的先不說,這個畫面質感世超必須誇一誇,這機器狗的耳朵動起來就跟真的似的。而且在機器狗奔跑的過程中,沒有看到特別明顯的變形,畫面流暢,地面上的倒影也都對上了。
就是鏡頭移動沒能體現出來,還有越過汽車的方式,跟世超想象中的多少差點意思。
值得一提的是,這次可靈2.0還上新了一個叫做多模態編輯的功能。基於一個影片,咱可以進行替換、增加和刪減元素。

世超用上面機器狗的影片試了下這個功能,再上傳一張柯基的照片,讓可靈2.0幫我把影片裡的機器狗換成柯基。
大夥兒看看效果,評價一下?
原來的車流背景看不到特別大的變化,柯基的運動軌跡也跟機器狗基本一致。理論上,咱們還可以基於機器狗的影片做更多改動,比如把馬路變成花田,或者再多加一隻金毛之類的。
根據快手高階副總裁蓋坤的說法,可靈定義了一種人和AI互動的新語言Multi-modal Visual Language(MVL)。

啥意思呢,就是以前咱們用文字跟AI說要生成啥樣啥樣的影片,最後的結果多多少少都會有偏差。但如果你多給一個圖片和影片的參考,AI就能更懂你。

這麼說吧,多模態編輯的功能讓影片的可控性更高了,對於影片生成和影片後期編輯來說,都有不小的幫助。
所以測試下來,世超覺得可靈2.0在產品的深度和廣度上,確實下足了功夫。不敢說已經能碰瓷攝像機了,但整體瑕不掩瑜,如果能把價格也打下來,那就更好了。
有一說一,自打去年6月快手推出可靈以來,滿打滿算也才一年時間不到。但無論是技術水平,還是全球知名度,可靈都是眾多玩家裡比較拔尖的那一個。

上個月快手發財報,還首次披露了一組資料:截至2025年2月,可靈AI累計營業收入已突破1億元大關。
雖然在快手的整體營收面前,可靈的這丁點收入充其量也只是蒼蠅腿。
但有個問題,目前市面上的AIGC產品收費且營收能幹到1億的,又有多少?
並且快手的財報中也提到,2024年第四季度,快手AIGC營銷素材日均消耗超3000萬元人民幣,也就是說,有不少廣告主開始選擇用AI生成的素材來做營銷。
而且快手CEO程一笑也表示,AI大模型預計可以把短影片營銷素材的製作成本,降低60 – 70%甚至更高。
所以,快手完全有給AI提供穩定商業化的潛力。
如果可靈過後能夠跟快手形成深度聯動,不僅AI的商業化有著落,說不定也能借AI重做一個快手。
撰文:沒瓜西
編輯:江江&面線
美編:富貴
圖片、資料來源:
可靈AI

