20天使用者超百萬,全球增速第一!這家國產影片模型公司是真的“快”

新年伊始,國產影片大模型 Vidu 2.0 正式釋出,一上線就來了一記重磅組合拳:
  • 速度上,秒級生成,影片生成速度跑進 10 秒;
  • 價格上,全新套餐直接將成本打下來了,生成單秒影片僅需 4 分錢,直接推動影片生成走向“分”時代,同時上線「錯峰模式」,支援閒時不限量生成,不卡積分、不卡條數,簡直不要太香;
  • 模型效果也更上一層樓,首尾幀全網最流暢,風格和多主體保持更穩定,鏡頭運動表現最佳;
總結起來就是“極致高科技,極致價效比”,這也意味著影片大模型迎來“奇點時刻”,開啟“人人可用”的規模化階段。
此外,一向低調的 Vidu 研發團隊也罕見公佈了運營資料。據官方釋出,自 2024 年 7 月底全球上線以來,Vidu 僅用了 20 天使用者數就突破百萬,上線 100 天使用者數就突破千萬,截至目前來自全球 200 個國家和地區的使用者在 Vidu 平臺上共計生產了上億條影片。根據目前已公開的資料來看,Vidu 是目前全球增速最快的 AI 影片模型產品。

生成速度最快不到 10 秒,比快更快

2024 年以來, 影片大模型雖然在效果、玩法上迭代很快,但是離真正普及仍有段距離,生成速度是其中的關鍵阻礙。
暫且不說作為免費使用者,想要生成一段素材,動輒要面臨小時級別的排隊時間,此外實際推理環節的時間非常漫長。比如國外同類產品想要生成一段畫面,都是分鐘級別。

排隊時間畫面

生成時間長,且效果不可預期,看似在 AI 的加持下,影片製作的效率得到了大大提升,但實際上,使用者並沒有因此節省多少時間。
而生成速度快一直是 Vidu 的拿手好戲,早在去年 7 月底全球上線 1.0 版本時,Vidu 單片段的實測推理速度就已跑進了 30 秒以內,當時就實現了全球最快,此後隨著不斷迭代,Vidu 生成速度進一步提升。
而這次 Vidu 2.0 在生成速度上更是直接放了個大招,影片生成速度突破至秒級,不管是圖生影片、首尾幀生影片,生成 4 秒 512P 單片段影片不到 10 秒,喝口水的功夫影片就生成了。

Vidu 2.0  512-4s 圖生影片生成速度即時測評

相比於之前版本,Vidu 2.0 生成速度進一步提升,從 30 秒到 10 秒,提升了三倍。
對於廣告製作、影視動畫等專業內容創作場景來說,Vidu 2.0 將帶來顯著的效率提升。
以廣告商業片為例,傳統廣告製作流程繁雜,需要經過策劃、拍攝、後期剪輯、配音等環節。一般來說光拍攝週期可能在 3-5 天,後期製作更是耗時耗力,從 5-15 天不等,遇到複雜的動作特效或者畫面特效需要更長的時間,總體看,一條 1 分鐘廣告片的交付週期在 1 個月左右。
Vidu 則徹底重塑了流程,尤其在 Vidu 2.0 的加速下,理想狀態下,僅需花費 5 分鐘就能跑出足夠 1 分鐘時長的影片素材,這不單單直接省去了最耗時費勁的實拍環節,還能夠節省 90% 的後期製作環節。
短期來看 Vidu 2.0 已推進影片生成進入“秒級時代”,隨著生成時間的快速提升,長期來看,影片生成逐步走向即時生成,未來將誕生全新的內容互動形式,創造類似互動短劇、互動遊戲等全新使用者體驗。

加量還降價!單秒影片成本僅需“4 分錢”,百元就能產出 1 分鐘商業片

影片大模型最近被廣泛討論,吸引了很多使用者體驗,但是其中也不乏槽點,特別是付費方面,使用者似乎陷入到了影片大模型的新型消費黑洞。
本來希望用 AI 影片工具來節省成本,但是在實際使用過程中發現卻與預期不一致。目前市場上的影片模型採用的是訂閱制,除了不菲的訂閱費之外,每月還會有積分的限制。以 Runway 為例,產出一條素材需要花費 25 積分,每月 625 積分的話只能產出 25 條 5 秒左右的素材片段,比如做 1 分鐘的廣告片至少需要可能 5 分鐘甚至更多的素材,每月 625 積分是遠遠不夠用的,若生成質量不高,還需要不斷地提升會員權益,陷入不斷買積分的迴圈黑洞中。
實際上在 Sora 剛上線的時就有海外使用者吐槽 Sora 價格“太貴了”,生成一個 5 秒 480P 影片成本為 0.5 美元,摺合人民幣 3.63 元,生成一段 1080p 影片成本更是高達 27 元。
此次 Vidu 2.0 推出了全新的收費套餐,直接將每秒單價成本降至最低 4 分錢,真正讓人人都能用得起。
橫向與同類模型產品對比,Vidu 2.0 的價格也可以說是“真香”。
以各家 720P 每秒單價計算的話,Vidu 2.0 為 0.258 元/秒,行業平均價格約為 0.6 元/秒。大致算下來的話,Vidu 2.0 720P 的收費僅為行業平均的 43%,也就是連現在業內平均價格的一半都不到。Runway 雖然效果不錯,但是每秒單價超過了 0.5 元,實際對於使用者來說仍然是筆不小的支出。
價格便宜了就意味著可以生成的影片素材更多了。以 720P 為例,目前市面上的影片模型,10 元錢平均只能生成 20 秒的影片,而 Vidu 2.0 能生成 38 秒的影片,接近行業平均水平的兩倍。
影片生成進入“分”時代意味著可能不到百元的成本我們就能完成一支短片的製作。
可以粗略地算一筆賬。以 1 分鐘的短片的製作為例,通常傳統廣告片製作需要經過平面、動效、剪輯等流程,需要僱傭剪輯師、畫師、特效師等等,即使是一個 4-5 人的小團隊,按照普通出品水準,1 分鐘廣告片的行業平均成本至少也在 3000-5000 元左右。
而採用 Vidu 2.0 生成 1 分鐘商業廣告片素材的成本在 3-5 元左右,即便考慮素材的有效率和後期剪輯配音等成本,1 分鐘廣告片的成本也大約為 100 元左右,相比傳統制作廣告,成本下降了 30-50 倍。
當然若使用者不著急立刻生成,而對成本有嚴格的控制,或者想進一步薅 Vidu 的羊毛,那麼還可以試試 Vidu 悄悄上線的省錢妙招——“錯峰模式”。
“錯峰模式”有點類似於飯店閒時特價,使用者申請的任務將排隊等待流量低峰時執行,錯峰生成不僅不扣使用者現有積分,而且生成素材無限量,想生成多少次就生成多少次,對於影片生成的使用者來說,不花積分就能生成無限量的影片素材,這波羊毛不薅白不薅。既可以有效避免高峰時期的等待期,也能幫助使用者進一步節約成本,實現資源的有效利用,主打一個“加量還降價”。
已有率先體驗 Vidu 2.0 內測的使用者直接在社交平臺評價生成速度和無限生成“很爽”。

風格、主體、動作穩定性更高

在影片大模型行業一直存在著不可能三角,很難同時做到“又快又好又划算”。但是若想要實現影片大模型的普及,就需要滿足使用者的“既要又要”。
讓人驚喜的是,這次 Vidu 2.0 恰好滿足了使用者在速度、價格和生成效果一個都不能少的訴求。不僅生成速度快,價格降到了“分”,而且效果質量上有了更進一步的升級。
一個字總結就是“穩”。風格一致性上保持得更好,畫面細節、主體更加穩定,鏡頭運動理解更強。正如一位 AI 影片愛好者所評價的,Vidu 2.0 穩定發揮,給使用者提供了牢靠的保障。
國外使用者生成的Vidu不同版本對比影片

圖為社交平臺上內測使用者對Vidu 2.0的評價

風格一致性保持更穩

目前市面上影片生成工具上線了非常多的風格模版,比如動漫、中國風等,但是對於真正的使用者而言,用起來最為關鍵的不只是風格多樣,而是在影片生成過程中始終保持風格一致,這才是產業化商業化內容落地的核心。
在風格保持上,Vidu 2.0 圖生影片非常穩定,能夠完整理解風格元素,並始終保持整體畫面風格一致。
下圖是一位捲髮男子在花叢中的油畫,整體風格偏印象派。對比各家影片生成效果如圖:
可以看到,Vidu2.0 有更好的風格保持力, 男生手中的花與畫面背景的花是一致的,油畫風格貫穿始終,其餘模型都出現了雖然風格還行但大幅度崩壞,降維/丟失細節,或是風格直接變化的情況,比如 Pika 2.0 和 Sora 直接變成寫實風格了。
看到風格一致性,小編突然有了個想法,直接將商品的海報圖用 Vidu 2.0 參考生影片變成動態影片,比如做一個貓糧的影片宣傳,比起靜態圖,貓咪伸出爪子吃貓糧的時刻更能引發貓主子們的購買慾。

鏡頭運動表現更佳

針對使用者訴求比較高的鏡頭運動,此次推出的 Vidu 2.0 在鏡頭運動表現上更加自然流暢,對於鏡頭運動指令的理解也更到位,在電影中常見的上下左右推拉旋轉鏡頭運動,Vidu 2.0 在同類影片生成模型中表現更佳。
以下圖動漫人物為例,對比幾家的效果:
對比來看,Vidu 相對於其他模型較為領先,尤其是 Vidu2.0,其對於順時針旋轉的理解更為優秀,超出了大部分模型。對比來看,runway 旋轉鏡頭理解到位,但是人物在旋轉過程中偏靜態,有點類似於動態 PPT,Pika 運動幅度大但對部分鏡頭理解有問題,將旋轉理解為人物自身的旋轉而不是鏡頭的旋轉, Sora 更是完全沒 Get 到旋轉鏡頭的意思。

首尾幀畫面切換更加自然

繼 2024 年 10 月 Vidu 首次上線首尾幀功能,此次 Vidu 2.0 首尾幀的效能又有了進一步提升。
相對於 Vidu 1.5,Vidu 2.0 兼顧了想象力和穩定性,實現了兩者更好的平衡。對於首尾幀中間的過渡更加絲滑流暢,畫面穩定性更強,同時在首尾幀中間的場景切換、鏡頭切換更具有想象力,類似某種鏡頭“黑魔法”,透過首尾幀生成的鏡頭語言切換,體現更多故事背後的故事。
如下面的影片,從兩個古人在秋天圍爐喝茶的畫面一下穿越到大雪紛飛的古城街頭,Vidu 2.0 生成的影片更讓人有種瞬時穿越感。相對而言同類產品則出現了比較多的畫面跳變情況,切換生硬,整體畫面非常不連貫。如 Luma1.6 和 runway 在切換過渡上並不絲滑,有些許卡頓,Sora 切換讓人想起了 PPT 幻燈片模式。

參考生影片更穩更像

作為全球首發的參考生影片功能和多主體一致性功能,Vidu 在影片生成的可控一致性方面一直位於行業第一梯隊。
隨著 Vidu 2.0 的推出,參考生影片的效能又經歷了大幅的提升。
在不同風格的主體和背景的穩定性上,Vidu 2.0 不僅相較 Vidu 1.5 提升較大,而且與 Pika 2.0 相比,Vidu 2.0 在穩定性上拉開了明顯差距。
prompt:一個鴨梨頭的角色滾動著身體向前一步,抱著花束靠近一個草莓頭的角色
參考圖:
可以看到在三維動畫風格中,Pika 2.0 的影片中出現了崩壞的情況,相對而言 Vidu 2.0 在多主體情況下仍然保持了畫面主體和背景的一致。
更讓人驚喜的是,Vidu 2.0 參考生對於主體相似度已進化到了 Next level,主體相似度保持得更好,生成的影片的主體、背景都與參考圖更像。
以下圖兩個動漫角色為例:
prompt:A dynamic action scene set in a back alley. Two men engage in a fierce fistfight, exchanging powerful blows with all their might. The camera is fixed at a bust-up angle, capturing the lively expressions on both men's faces. One is a blond man in a white suit, the other a dark-haired man in red.
Every punch and facial expression is meticulously rendered, immersing the viewer in the action.
Japanese animation style.
可以看到 Pika 2.0 生成的影片中,白衣男生與參考圖完全判若兩人,眼睛都變成綠色了,很難將參考角色與影片聯絡起來。Vidu 1.5 在主體保持上遵從得也不太好,相對來說 Vidu 2.0 生成的影片角色能做到一眼認出的程度,與參考圖主角相似度非常高,即使在打架這種大幅度動作中也能保持主角的一致。

使用者數 20 天破百萬,百天破千萬,全球增速第一

Vidu 此次首次對外公佈了運營資料,自 7 月底全球上線以來,Vidu 僅用了 20 天使用者數就突破百萬,上線 100 天使用者數就突破千萬,截至到目前 Vidu 平臺累計生成的影片數突破億條,其中“參考生影片”功能僅上線三個月,使用者利用該功能生成的影片數就已達到千萬級別。據目前媒體已公開資料來看,Vidu 是目前為止全球增速最快的 AI 影片模型工具。
雖然 Vidu 未公開截至目前的使用者數,但相比市面上已知的競品情況,愛詩科技於 11 月 18 日公佈使用者數超 1200 萬,討論度較高的可靈於 12 月 10 日公佈的使用者數超 600 萬,而相比之下,Vidu 在 10 月底就實現了千萬使用者數,使用者規模遠超可靈。沒想到,一向低調的 Vidu 在使用者規模上已領先同行一個身位。
從使用者覆蓋地區看,目前 Vidu 已服務了全球超過 200 個國家和地區,使用者規模位列全球第一梯隊。每天在世界不同國家,不同年齡層職業的使用者都在使用著這款來自中國的影片模型工具。
遠在美國俄克拉荷馬州的一位 60 歲老奶奶是 Vidu 的忠實粉絲。MamaFish 是一名兒童書作家,她非常擅長寫兒童故事,非常希望讓她寫的故事透過影片形式讓更多小朋友接觸到。但由於不會做影片,僱傭人做影片對於其個人來說花費不小,這個夢想一直沒有實現。不過偶然間接觸到 Vidu 後,她發現即使不會做影片也能利用 Vidu 幫助生成她想要的影片,在短短 20 分鐘內建立 50 多個場景,而且成本非常便宜。MamaFish 的影片不僅在 YouTube 上廣受歡迎,而且還因此獲得了更多收益。

素材為 MamaFish 利用 Vidu 創作的兒童動畫短片《If I Were A Cow》

即使是動漫強國日本,也有使用者開始用 Vidu 來製作動畫,提升創作效率。@8co28 是 Vidu 第一批早期使用者,同時還是一位二次元愛好者。此前嘗試過 kling、gen3、hailuo、Pika、luma 等產品來創作二次元動畫,但是整體體驗後,他最終選擇了 Vidu,在其看來 Vidu 在參考生影片方面要比其他平臺有更強大的優勢,同時對於大動作大動態的處理也十分突出。目前 @8co28 也因為做的這些 AI 影片的出色效果,吸引了更多人的關注,目前粉絲已經超過 35 萬。

素材為 @8co28 用 Vidu 生成的 AI 動畫

不僅是 TOC 使用者,甚至在一些國內出海企業中,Vidu 的產品力也獲得了眾多企業的認可。Evoke 是一家面向海外使用者的 AI 圖生影片應用,也是 Vidu 早期的 Maas 客戶。
對於一家應用 APP 公司來說,最為關鍵的指標是使用者留存和月活躍使用者數。使用者留存度高,月活高,通常代表產品黏性高,使用者規模大,這通常也意味著變現能力更強。
對於 Evoke AI 圖生影片應用來說,就是能讓使用者用起來輕鬆、絲滑,能準確理解使用者意圖,同時快速生成。自從接入 Vidu 的 API 後,據 Evoke 內部資料,在「擁抱」「親吻」等場景上,相較於同類影片生成平臺,Vidu 在模型準確率提升了超 60%,在影片生成時間上從 270 秒縮短到 35 秒,時間相對下降了近九成。使用者滿意度也有顯著提升,可以看到使用者取消影片生成的機率降低了 10%。而這些使用者體驗幫助 Evoke 在海外獲得了更多註冊使用者和付費使用者。
可以說,這回 Vidu 算是把“”極致高科技,極致價效比”玩明白了,Vidu 2.0 的釋出也標誌著影片生成領域邁向“人人可用”階段,意味著影片生成真正從小眾走向大眾。
Vidu 2.0體驗連結:www.vidu.cn

相關文章