為什麼AI影片工具長得越來越像？

作者丨kiki

編輯 | 山核桃

距離OpenAI釋出Sora過去一年多，AI影片賽道上演了一齣「王座交替」的爽文故事。

在Sora釋出後，AI影片賽道玩家以對標它為目標，流傳在社交媒體上的一張梗圖是這樣描繪的：坐在王座上的Sora看著眼前膜拜者——Runway、Pika、PixVerse等十餘個競對。

圖源：網路

但現在隨著可靈、即夢等中國玩家成為牌桌上的新玩家，總被吐槽「期貨」的Sora光芒逐漸變得黯淡，一位AI影片從業者告訴「矽基研究室」，對標Sora早已不是他們的目標，現在他們把關注點放在加快縮短AI影片生產和消費間的GAP。

在不少AI論壇的現場，AI影片玩家們談Sora的少了，談DeepSeek的多了，這背後是對AI影片加速商業化和普及的一種期待。

似乎也是某種默契，進入2025年，不到半年時間裡，AI影片玩家紛紛釋出最新的影片生成模型和產品更新，AI影片的戰火也越燒越旺。

從著力解決影片生成的一致性和可控性再到降低產品門檻，增強可編輯能力，融入工作流，讓產品更好用，行業玩家也以一個月，甚至是半月一迭代加速AI影片落地，但新的問題也逐漸擺在臺前。

有多位中腰部AIGC創業者向「矽基研究室」表達了自己的焦慮，從商用角度看，當前AI影片落地還存在諸多困難，商單報價在走低，抽卡不穩定下，製作成本還是偏貴。

除此以外，就現有產品功能看，「矽基研究室」梳理發現，多數AI影片產品功能正趨於同質化——除了創意特效外，大多數AI影片產品都支援主體參考、音效生成、多模態編輯等，隨著功能的豐富、選擇的增多，也將賽道玩家間影片生成的質量、成本和互動形式等能力的競爭擺在了眼前。

這也意味著，即便不提Sora，國產AI影片玩家的壓力也並沒有減輕。

不提Sora的AI影片玩家，在卷什麼？

比起此前對生成時長、模型引數的強調，大半年來，不提Sora的AI影片玩家將這場「軍備競賽」的重點放在了三個維度上——卷一致性、卷可用性、卷可玩性。

所謂的「一致性」指的是影片生成過程中幀與幀之間的過渡性、動作的連續性和場景的真實性等。

由於影片畫面往往包含了人物角色、道具、環境等不同元素，如何在生成過程中實現這些元素的互動，在連貫影片內保持一致性，這也是AI影片玩家長期一直在解決的問題。

而在卷「一致性」上，AI影片玩家的動作也整齊劃一。

一方面是提升圖生影片能力，比如增加首尾幀、筆刷工具和多圖參考等，讓使用者自定義影片的開頭和結尾的同時，筆刷支援運動方向控制，模型可以根據使用者上傳的參考影像提取人物、場景或風格特徵，從而保證生成內容中的一致性。

在輸入端加強控制力，不止是卷首幀。包括Runway在內的AI影片玩家還在輸入端就打出多模態融合，比如影片轉影片、多圖混合生成等。

去年10月，Runway就推出了Act-One功能，使用者可以直接錄製一段影片，將素材中物件的面部表情直接轉移到AI生成的角色上。

Runway在去年10月推出Act-One功能

圖源：官方

「一致性」本質上是為了影片生成的質量，這又與底層模型效能和訓練資料的質量相關，目前走在前列的AI影片玩家雖並未高調大打「基模牌」，但強大底座模型的穩定迭代是頭部玩家的標配。

快手自去年6月推出可靈大模型後，目前可靈大模型已迭代至2.0版本，位元組低調上線Seaweed和PixelDance，Runway在今年4月推出Gen-4，同月生數科技也釋出Vidu的Q1模型，頭部AI影片玩家至少保持半年一次基座模型更新的節奏。

而所謂的卷「可用性」則是完善創作者工作流相關配套工具。

AIGC從業者可可告訴「矽基研究室」，據她觀察，在「可用性」上，創作者主要關注三個核心問題：

一是動態編輯能力，可以圍繞影片一次性生成的結果進行再調整；

二是鏡頭運動能力，包括大幅度運動、特色運動視角等等，這體現畫面表現力；

三是端到端能力，包括從分鏡、影片生成、音效、剪輯到分發的一站式能力。

針對動態編輯，目前可靈等玩家支援多模態編輯，給影片替換、新增或刪減元素，比如Pika推出的Pikawaps；而在端到端能力上，標配的「音效生成」，即夢的「故事創作」模式可批次生成分鏡，Runway也上線了影片編輯器。

除了一致性、可用性外，透過創意特效和模版卷「可玩性」則是不少玩家引流的關鍵手段。

吃到這波紅利的典型代表也有不少，比如靠著Pikaffects、Pikadditions走紅網際網路的Pika，靠著毒液效果走紅的PixVerse，還有承接GPT-4o吉卜力風流量外溢的Vidu……

Pika近期推出的髮型AI特效

圖源：Pika官方

「矽基研究室」梳理發現，多數AI影片產品功能正趨於同質化，所謂的「特色功能」會很快被相互借鑑。

除了創意特效外，大多數AI影片產品都支援主體參考、音效生成、多模態編輯等，有業內人士表示，這是正常現象。“現在AI影片的互動形式和產品形態各家都還在探索，互相抄作業和‘致敬’很正常。”

AI影片難打“價格牌”

更多的工具、更豐富的功能，廠商打著「人人都是導演時代」的口號，但有AI影片創作者卻覺得越來越焦慮了。

2024年抱著對AI影片的好奇，可可開始嘗試AI影片創作，就是「焦慮大軍」中的一員，從2024年下半年開始，她明顯感覺到AI影片玩家加速迭代模型和產品，甚至是以周為單位。

但快速迭代下，像可可這樣的腰部創作者正在經歷陣痛——降不下去的製作成本，被逐漸壓低的報價。

「矽基研究室」瞭解到，AI影片多為定製化專案，一般按照影片時長（每秒）或鏡頭數報價，一般三分多鐘的AI短片製作週期在1-2周，但可可提到，隨著客戶對AI影片降本需求的增加，預算也在降低。

與之對應的則是AI影片工具堅挺的價格。以可靈2.0為例，目前2.0生成一條5秒鐘的影片需要100靈感值，黃金會員月費58元可獲得660靈感值，能抽卡6次，一次生成約為10元。

可可提到，如果對畫質要求低，單個鏡頭(一般1-5s）需要抽卡5次左右，這意味生成一個鏡頭就需要50元，如果涉及更復雜的場景和效果抽卡次數可能高達數十次，她曾經單個鏡頭抽卡次數達40次，以此計算，單個鏡頭就需要400元，一個三分鐘的AI短片在不算人力成本下保守估計就要數萬元，和她此前的製作成本相比，是不划算的。

較高的成本，這也是為什麼有一批AIGC創作者並未使用新版本，而是繼續使用可靈1.6的原因所在。

有業內人士也提到，此次可靈2.0主要針對是影視商用領域，並非是如可可此類的小B使用者。

據可靈此前釋出的《AI影像創作者手冊》，中信證券測算其單部短劇（3.5分鐘）成本測算約為8100元，即便可靈2.0很貴，但與真人短劇製作成本相比，依舊能看得見降本的空間，但降本幅度在縮減。

梳理主要AI影片玩家的商業化方案，「矽基研究室」認為，比起此前各大主流模型廠商掀起的「價格戰」，推動行業邁入「按釐計價」時代，影片大模型的價格下降趨勢並不明顯。

C端目前採取的階梯付費訂閱模式，國內對比國外玩家價格優勢明顯，比如大打價格優勢的Vidu甚至效仿DeepSeek上線了「錯峰模式」。但在最先進模型上，頭部廠商的定價並未鬆動，譬如可靈2.0生成一個5s影片約為10元，而Runway Gen4則為8.6元。

反倒是在B端API上，國內廠商的價格優勢明顯高於國外廠商。

一位行業人士預測，短期內影片大模型的定價不會出現激烈的變化。

一方面，從現有產品層看，儘管目前開源影片生成模型中也不乏如阿里通義萬相Wan2.1等玩家，但取得身位領先的依舊是閉源大模型。阿里萬相團隊在技術報告中也提到，目前影片生成賽道，儘管開源模型與閉源商業模型間的差距在不斷縮小，但目前還存在效能不佳、能力有限、效率不足等問題，Sand.ai創始人曹越也提到，在影片生成領域，技術路徑還尚未收斂。

另一方面，降價本質上也是一種定價營銷策略，目的也是讓更多人將AI影片用起來，但前提是產品形態和互動已經ready，但現階段各大廠商還在探索產品形態，不斷完善AI影片生產環節，如前文所說，去跨越生產和消費那道鴻溝。

「保證自己在牌桌上」

和那些熱門的垂直領域一樣，AI影片早已成為巨頭和創業公司下一個押注的沃土，擠滿了躍躍欲試的玩家。

據「矽基研究室」不完全統計，2025年開年，就有十餘家AI影片領域初創企業斬獲融資，既包括了像Runway這樣的明星獨角獸，也不乏Sand.ai等新玩家。

從所屬領域來看，既有「模型+產品」兩步走的通用型選手，也有聚焦在企業級市場、影片編輯領域的垂直型選手。