2025.07.05

本文字數:2033,閱讀時長大約4分鐘
作者 | 第一財經 呂倩
近一個月,多款影片模型新品釋出,包括生數科技影片模型Vidu更新至可一鍵生成32秒影片,支援音影片合成與4D生成;MiniMax釋出海螺Hailuo-02,支援最高1080P、最長10秒的超清影片端到端生成;百度(9888.HK)釋出首個圖生影片大模型MuseSteamer,面向包括廣告商在內的專業影片內容創作者。
但在過去幾年,這一賽道並不被市場看好。
對比AI領域目前正被資本追捧的Agent(智慧體),影片模型熱度並不算太高。瑞銀(UBS)研報認為,影片模型領域的競爭不會像大語言模型領域的競爭那樣激烈,主要是受影片模型訓練所需的影片語料內容所限。但同時,目前市面上由大廠與明星創業公司組成的戰隊,正在基礎模型效率提高的背景下,加快產品更新與商業化落地。

頭部影片模型價格對比

近一個月的影片模型產品更新之前,Sora的熱度已帶動一批新品面世。包括2024年上半年的愛詩科技PixVerse、Runway Gen-3、Luma Dream Machine,下半年的生數科技Vidu、智譜清影、字節跳動PixelDance、MiniMax海螺等。
一方面,影片模型你追我趕。據AGI-Eval(上海交通大學、同濟大學等高校和機構合作釋出的大模型評測社群),2024年12月,PixVerse-V3、可靈1.5、Video-01的得分(評測維度包括影片-文字一致性、影片質量、運動質量等)超越Sora。
但同時,受限於技術成熟度、商業化、成本高等因素,影片模型的創業熱度並不及AI應用層,主要由大型網際網路/科技企業組成,由愛詩科技、生數科技、Pika、Runway、MiniMax等明星創業公司補充。
此前,MiniMax創始人閆俊傑表示,影片類工作複雜度比文字更難,上下文文字很長,一個5秒的影片就有幾M(兆位元組,MB)大小,但文字領域,5秒看100個字的大小可能都不到1K(千位元組,KB),這是幾千倍的儲存差距。該差距帶來的挑戰便是如果透過基本文字構建的底層基礎設施來處理、清洗、標註資料。另外,閆俊傑稱,影片開源內容沒那麼多,需要付出的耐心更大。
首個被稱為“中國版Sora”的生數科技也在今年進行了更新,此前輪次中,螞蟻集團、BV百度風投、啟明創投等機構押注生數。對於投資人對影片模型的判斷,清華大學人工智慧研究院副院長、生數科技創始人兼首席科學家朱軍對記者表示,早期孵化看團隊質量,中後期看團隊技術與商業化能力。
一位一級市場關注AI領域的投資人對記者表示,近期一家剛披露千萬月活使用者規模的影片模型平臺,嘗試向一級市場講述做影片模型領域TikTok的“故事”,但投資人暫未買賬,“成本壓力與商業變現之間的鴻溝太大了,”該投資人稱。
曾參與投資Perpleixty 、Character.ai、Mistral、Harvy以及Pika等AI 初創公司的矽谷Solo VC 投資人Elad Gil(埃拉德・吉爾)此前表示,現今模型型別琳琅滿目,但從資金角度來看,大部分投資可能會流向模型公司,因為它們資金需求更大。但在數量上,行業將看到更多應用程式開發公司,而非基礎模型公司。

截至5月4日市場份額佔比情況

具體落地方式上,目前大模型收費模式主要包括API、訂閱、廣告、定製化四種。從AI產品商業化程度來看,B端變現模式更加清晰,C端在國內市場多以免費為主,海外市場以付費模式為主。
影片模型也主要分為To C端與To B端兩種服務模式,前者主要提供付費訂閱服務,如快手可靈、位元組即夢、智象未來(HiDream.ai)等,透過免費版、標準版、高階版、尊享版等不同等級訂閱服務收費,價格每月數元到數百元不等。後者主要透過API介面和解決方案服務形式收費,如快手可靈、生數科技、愛詩科技等,服務領域涵蓋影視、網際網路、營銷廣告等,每月收費數十元至數萬元不等。
6月6日,快手披露可靈AI在正式上線的第十個月(即今年三月)突破一億美元ARR(年化收入執行率),月度付費金額在今年四月和五月連續突破一億元人民幣。除了可靈AI,其他影片模型廠商暫未披露明確的營收資料,頭部平臺以數千萬美元的ARR規模為主。以可靈AI為例,據高盛研報,2P(專業內容創作者)/2C訂閱收入佔可靈AI總收入的70%,2B API呼叫佔30%。
生數產品方面,朱軍表示,目前主要有SaaS和MaaS兩種形態,前者數千萬C端使用者,主要是專業和半專業創作者做內容。B端產品目前已經落地於廣告、影視、文旅等場景。
MiniMax影片模型商業化也分為B端與C端。前者透過提供API介面服務,將影片生成能力輸出給企業客戶,支援多種應用場景,如影視製作、廣告創意、教育內容生成等。後者支援使用者透過簡單指令生成高質量影片,平臺提供會員積分制在內的多種付費方案。今年6月下旬,MiniMax官方披露,從去年8月底釋出海螺影片至今,已幫助創作者生成超過3.7億個影片。
據研究機構Fortune Business Insights報告顯示,2024年全球AI影片生成器市場規模達6.148億美元,預計到2032年將增長至25.629億美元,2025年至2032年間的年均複合增長率達20.0%,而大語言模型的預估增長率約35.92%。
在可預見的增速範圍內,朱軍認為今年影片大模型商業化就會加快,市場對影片類消費與需求非常廣闊,這也是影片賽道與文字賽道不一樣的地方。目前行業最頭部影片大模型平臺都有各自的特色與商業化路徑,沒有走到類似大語言模型那樣“卷”的狀態,暫時也不會出現一家獨大的局面。