火遍200多個國家和地區的AI影片模型,竟然來自這家低調的中國公司

作者

李京亞

郵箱

[email protected]

AI影片模型正以意想不到的方式影響著世界各地每個人的生活,也包括一位遠在大洋彼岸的60歲老奶奶。
Kimberly Fish是一位兒童作家,和丈夫住在美國俄克拉荷馬州的一個牧場裡,有一個溫馨的家庭,她已經60歲了,是幾個孩子的奶奶。
而最近她又有了一個新身份——AI影片創作者。她使用影片模型創作的兒童動畫在YouTube獲得了很多人的喜愛,她的收入也增加了不少。
Kimberly Fish使用的影片模型來自於一家中國AI公司生數科技旗下的產品Vidu。由於影片模型技術的全球領先,目前Vidu是全球使用者增速最快的影片模型產品,目前已覆蓋200多個國家和地區,並正深刻改變著世界各個角落每個人的工作和生活。
1
60歲奶奶的影片夢
Kimberly Fish是一名頗有成就的兒童作家。她的小說在亞馬遜上很暢銷,獲得過不少區域性獎項,她的書在Kindle上評分大多維持在5分(滿分),多以“comfort(舒適)”命名,帶給人滿滿的幸福感。
Kimberly Fish的亞馬遜主頁
去年,她的編輯告訴她,人工智慧正在徹底改變圖書出版流程,可以幫她製作圖書插畫,也可以實現語音互動閱讀的效果。
這引發了她的興趣,Kimberly 一直希望將筆下童話變成影片。在某種意義上,她是一個非常全能的創作者,擅長寫作,會寫歌,對教育頗有研究,除了不會畫畫、做影片。專業影片製作的高昂成本和複雜技能,是橫亙在她面前的一道門檻,她需要花很多時間學習適應,這並不像開啟手機攝像頭去拍攝那麼簡單。
她花了很大力氣學習提示詞工程,但她發現,不但生成時間很長,而且生成效果不可預期,製作的影片與“提示中寫得完全不同,要麼臉部會奇怪變形、融化,要麼人或動物會在奇怪的地方從身體上長出多餘的肢體”,這讓她很沮喪。市面上的影片生成工具生成任何一段素材,動輒都要面臨小時級別的排隊時間,實際推理環節的時間也很漫長。
此外她也沒有足夠的經費。傳統的動畫片製作一分鐘影片上萬元,S級更是達到了20萬元/分鐘,即便朋友推薦的Runway每秒單價超過了0.5元,這對於她來說仍是一筆不小的支出。
直到她發現了Vidu。
Vidu滿足了她的各種需求,它能在10秒內生成一個影片,幾乎是“極速”。這幫助Kimberly可以在20分鐘內為兒童教育和娛樂影片建立50個場景,Vidu的“參考生”功能讓她所想即所得,支援她為家人制作動畫。這個不懂影片製作的兒童作家,在這個冬天實現了自己的“影片自由”。
事實上,生成速度一直是影片大模型的瓶頸。去年7月底,Vidu全球上線1.0版本時,單片段的實測推理速度就跑進30秒內,實現了全球最快,今年釋出的Vidu 2.0更是在生成速度上直接突破秒級。
“有了Vidu,我可以非常快速地完成動畫和影片。它讓我能夠比以往更快地製作內容,而且它做得非常好。”
在傳統圖書出版行業,一張插畫要用3個工作日完成,完成一萬張插畫需要16年時間,而藉助多模態大模型,這個時間縮短到2周。
此外,Kimberly 認為Vidu幫她省去了僱傭動畫師的成本。同時相比於其他影片生成工具,Vidu進一步降低了製作成本。以Vidu 2.0 的720P為例,其收費僅為行業平均的43%。
720P為例,目前市面上的影片模型,10元錢平均只能生成20秒的影片,而Vidu 2.0能生成38秒的影片,接近行業平均水平的兩倍。
Kimberly Fish用Vidu製作的作品《If I Were A Cow》在YouTube上獲得了很多點贊,她的頻道已經為其貢獻了三分之一的收入,很多粉絲在其頻道下留言,詢問如何製作內容。在Kimberly的啟發下,有更多美國使用者使用Vidu製作互動短劇、互動遊戲等有趣的內容。

Kimberly Fish利用 Vidu 創作的兒童動畫短片《If I Were A Cow》

Kimberly Fish的故事是Vidu在全球使用者中掀起海嘯的一個側影。
Vidu解決了困擾內容創作者的三個關鍵問題,生成速度,價格,一致性,創作者們欣喜地發現,不到百元成本,無需漫長的等待和排隊就能搞定一支精美的短片。
自2024年7月底全球上線以來,Vidu僅用了20天使用者數就突破百萬,上線100天使用者數就突破千萬,來自全球200個國家和地區的使用者在Vidu平臺上共計生產了上億條影片。
一位美國年輕網友Amir Kerr想生成一個兔子低頭手捧白球的影片,但其他AI都無法做到,因為它們需要像人一樣的面孔,但他驚喜地發現,Vidu 2.0成功做到了
1
日本湧現了一批“新海誠”
不僅是在美國,在有著深厚動漫歷史和成熟產業的日本,也湧現出了一群專業或非專業的AI動漫創作者們。他們成長於高濃度的二次元日本市場,活躍於動漫圈,對使用AI影片模型非常積極,他們有一個共同的稱呼——“新海誠們”。
一位在X平臺上很火的35萬粉絲AI 大V博主@8co28就是其中的一員。
他今年30歲,每天在推特上關注AI動態,是Vidu的第一批使用者。
此前他也曾嘗試用Runway、pika、Luma等其他產品平臺,但最終成為了Vidu的死忠粉,因為“Vidu能製作出比其他平臺更具魅力的影片”。現在他每天都會使用Vidu來進行創作並將作品釋出到X、TikTok、YouTube、Instagram、Threads等社交平臺。
從最初的Vidu 1.0到現在的Vidu 2.0,隨著對Vidu 功能越來越熟悉,他開始追求更高質量的藝術創作,也總結了一套AI影片製作流程。先用圖生影片,再用參考生影片,最後是文生影片。“Vidu的圖生影片”更容易達到想要的畫面,減少了創作失敗偶然性。”

@8co28 用Vidu生成的AI動畫

參考生是@8co28格外喜歡Vidu的一個功能。“Vidu創作二次元動畫片的參考生功能要比其他平臺強得多,對大動作大動態的處理也非常出色。”實際上參考生的功能的誕生就源於專業和非專業創作者們對於主體一致性上面的剛需,如果一個故事主體不固定,很難連貫性地講述一個完整的故事,更別提商業化了。
從影片效果上講,當前處在第一梯隊的海內外影片生成工具都有獨特偏好,Sora喜歡新增大量運動鏡頭,擅長做出更準確更自然的色彩搭配,Runway的動畫生成經常帶著一股老式CGI的感覺,“如同玩2000年的遊戲動畫”而Vidu在一致性全球領先,是使用者心中的“以穩定性之王”。
2024年Vidu全球首發了參考生功能,而其去年11月全球獨家釋出的多主體一致性更是增強了對於多主體、場景的控制,讓影片生成走向了規模化和可商業化。

用《魷魚遊戲》場景作為參考圖片製作的參考生影片,人物表情豐富,背景還原真實

一位日本AI創作者用一則頗具創意的場景測試了Vidu的多主體能力:一個女孩騎著巴哥犬去摧毀東京塔。創作者只是給了一張巴哥犬和女孩在書房打遊戲的圖,一段精彩的動畫片段就生成了,女孩從書房打遊戲瞬間切換到遊戲場景中,坐著巴哥犬用密集的子彈摧毀東京塔的畫面。生成的畫面細節豐富,切換也頗有點蒙太奇的感覺,整體可以與A級動漫媲美。
“斷層優秀(ダントツ)”這位日本AI創作者對於Vidu 2.0在動畫製作方面如此評價。
實際上Vidu已經成為創作者們製作動漫影片的首選。很多日本網友稱Vidu 2.0製作出的日漫短片效果,完全不輸大作。
推特上有很多活躍的日本網友分享Vidu的創作案例。矽星人發現,“新海誠們”與TikTok日本使用者的年齡層高度吻合,平均年齡在34歲。
AI動畫極大降低了創作者的門檻,也給了專業創作者更大的自由,當更多人成為了“新海城們”,也進一步豐富了日本的動漫產業生態。

" width="1720">

一位日本網友發帖表示,Vidu對於動漫常見的霧氣場景的表現非常優秀
不僅如此,影片模型在成本上的巨大優勢正在重塑內容產業格局。
隨著1月15日一部完全由AI生成的動畫《八雲與SETSU的怪談事件薄》登陸關西電影片道,影片模型已經推動日本傳統國藝動畫業迎來劇變。巨大成本優勢吸引批次動畫公司積極涉足影片生成領域。
實際上即使是像宮崎駿這樣知名的動漫導演,在早期時為了節約成本只能採用專案制的形式僱傭非正式員工,因為人力創作成本實在過高。
而現在有了Vidu這類影片模型,一個人或者幾個人就可以完成整個動畫製作的工作。

Discord使用者Mori用Vidu 製作了一支水平極高的音樂MV,整個製作環節都由他一人完成

爆款AI短劇《山海奇鏡》預告片的創作者“閒人一坤”發現,以前做類似規模的動畫專案,團隊規模通常需要40-50人,現在,整個專案組不到10個人就能高效運轉,人力需求直接降低到了原來的四分之一以下。成本上,傳統的影視拍攝需要投入大量資金購買專業裝置和軟體,動輒幾十萬甚至上百萬的投入。而使用Vidu,整體的軟體使用成本降到了一個完全不同的數量級,極大降低了創作的門檻和成本。
影片模型帶來的降本增效或許也將給國內的動漫產業帶來彎道超車的機會。
一位資深的動畫導演曾私下表示,過去國產動漫受限於高昂的成本和有限的資源投入,整個國產動漫行業發展緩慢。不過他在影片模型中看到了新的機會,並第一波轉型為AI導演。“國產動漫或許可以藉助影片模型快速崛起。因為當成本足夠低時,能生成無限豐富的內容供給,舊的市場格局將被打破,AI內容將佔據重要的一席之地。”其表示。目前他已經從Vidu創作的動畫中獲得了第一桶金。
Vidu帶來的降本增效不止在動畫行業,廣告製作、影視、遊戲等內容生產環節,也會因最優質的影片生成工具帶來新的產業變革。
目前廣告商業片的傳統制作流程,需要經過策劃、拍攝、後期剪輯、配音等環節,拍攝週期3-5天,後期製作5-15天,一條1分鐘廣告片往往需要1個月才能交付。而Vidu 2.0的迭代,意味著5分鐘時間就能生成1分鐘時長的影片素材,這不僅省去了實拍環節,還節約了90%的後期製作工作。Vidu 漸漸成為創作者工作者不可或缺的創作助手。
1
賦能生產的“神器”
在社交平臺等看得到的地方,Vidu在專業/非專業創作者群體中口口相傳,而在更加垂直的TOB領域,Vidu也獲得了很多企業客戶的青睞。
MaaS(Model as a Service)模型即服務,是現在非常流行的一種模型服務形式,核心業務是基於模型底座為使用者提供API(應用程式程式設計介面)或定製服務。
成立於2015年的克魯網路Evoke是Vidu早期的企業級客戶,這是一款面向海外使用者的AI圖生影片APP,Vidu能針對「擁抱、親吻」特色模板需求和「圖生影片」功能需求,提供API介面。
Evoke內部資料顯示,自從接入Vidu的API後,在「擁抱」「親吻」等場景上,相較於同類影片生成平臺,Vidu在模型準確率提升了超60%,在影片生成時間上從270秒縮短到35秒,時間相對下降了近九成。使用者滿意度也有顯著提升,可以看到使用者取消影片生成的機率降低了10%。而這些使用者體驗幫助Evoke在海外獲得了更多註冊使用者和付費使用者。
對於Evoke 應用來說,使用者留存以及獲得更多使用者增長的關鍵,一是希望使用者體驗絲滑,二是需要準確理解使用者意圖,並快速生成影片,Vidu極好地滿足了這些點。Evoke目前面向海外使用者發行了10餘款遊戲、工具和AI類APP,它一方面作為Vidu生態的一員擴充了Vidu的觸角,幫Vidu接觸到更多細分的場景,另一方面藉助Vidu大模型的能力在海外市場實現使用者規模和收入雙重突破。
影片生成和語言模型兩大賽道各有各的使命,影片生成賽道天花板高,產品迭代快,商業化是必然之結果,但競爭也殘酷異常。而今Vidu依靠技術紅利,打破了大多數AI影片生成產品功能單一的局面,作為國產影片大模型,憑藉技術上的優勢成為全球AI影片生成領域的引領者。
從日本十幾歲的二次元女孩,到美國俄克拉荷馬州年逾半百的奶奶,這款來自中國的影片生成工具,贏得了不同國家,不同年齡層不同需求使用者的認可。Vidu 依靠模型的降本、提速、產品效能的升級迭代,讓影片生成行業步入到普及階段。或許在不久的將來,Vidu將賦能每個人成為AI新時代的導演。
Vidu體驗地址(或點選閱讀原文):www.vidu.cn

點個愛心,再走吧


相關文章