上個星期,我一直飽受流感困擾,完全無法更新影片號:既沒有心思撰寫文案,更沒有狀態出鏡。這卻給了我一個很好的機會,嘗試能否完全依靠目前高度發達的生成式AI工具,做一期像樣的短影片。我的選題是:“雖然AI大模型推理成本大幅下降,但算力需求反而更高了,就像當年蒸汽機的發明,反而推動了全世界的煤炭需求。因此,今後算力作為一種戰略資源的地位會更重要。”全長大約1分鐘。
我躺在沙發上,把這段話輸入了DeepSeek R1。它用了28秒,生成了包括畫面描述、配音以及轉場效果在內的全套文案:
【開場:蒸汽火車噴著白煙穿越金色麥田,鏡頭切換至晶片內部流光溢彩的電子流動】
(背景音樂:科技感音效與蒸汽朋克風格音樂交織。)
【畫面:老式蒸汽機活塞特寫→現代伺服器叢集閃爍藍光】
“1820年,瓦特改良蒸汽機後,英國煤炭消耗量反而暴增300%——效率提升永遠會激發更大需求!”
【動畫:AI大腦吸收海量資料流,形成算力黑洞】
“今天,AI大模型單次推理成本下降80%,但全球算力需求正以每年翻倍的速度狂奔!GPT-4處理一本《戰爭與和平》,只需要你喝口咖啡的時間。”
【資料視覺化:地球表面升起無數光纜,構成神經網路覆蓋大陸】
(音效:資料處理聲逐漸密集)
“每個智慧客服都在消耗一座小城市的算力,每輛自動駕駛汽車都是移動的超算中心,這,就是AI時代的‘煤炭悖論’!”
【畫面:稀土礦脈與晶片工廠交替閃現,最後定格在量子計算機冷卻裝置】
"當演算法進化遇上物理極限,算力戰爭已悄然打響。從矽基晶片到光子計算,從液冷技術到星鏈基站,21世紀最硬的通貨正在重新定義——”
【結尾:火箭發射升空,尾焰化作二進位制程式碼照亮夜空】
"記住:蒸汽時代屬於煤炭,電氣時代屬於石油,而正在展開的智慧時代,誰能掌握算力之源,誰就能點燃下一個文明紀元!”
(字幕彈出:算力即權力)
老實說,上述文案稍嫌煽情,但不是什麼大問題,稍微調整一下即可。根據我提供的簡短選題,能夠做出這樣一份文案已屬不易。問題在於,目前DeepSeek尚不具備多模態(圖片/影片/音訊)生成能力,所以影片生成環節必須交給別的AI工具。那麼到底交給誰呢?
我馬上想到了可靈AI。嚴格地說,快手於去年6月釋出的可靈大模型,是第一個真正“震驚世界”的國產大模型,也是第一個在應用水準上超過國外競爭對手的大模型——只需要看看當初它上線之後,國外AIGC圈子鋪天蓋地的評價就知道了。OpenAI的Sora雖然官宣時間更早,卻要等到六個月後才全面上線。在國產AI進軍世界先進水平的道路上,可靈是一個十分重要的里程碑,足以載入行業史冊。
由於可靈AI目前只能一次生成最多10秒的素材,所以我把上述文案拆分成六份,依次進行生成。不是所有片段都完全達到了我的預期,但其中至少有兩個讓我比較滿意:“蒸汽機車駛過麥田”,以及“稀土礦脈與晶片工廠的交替閃現”。要知道,我不是一個專業的AI創作者;倘若我更熟練一點,生成的影片質量肯定會更高,不過現在的成果已經夠用了。
如果沒有AI的力量,我就只能從網際網路通用素材庫當中尋找相關片段,不但很難找到合意的,而且難以規避版權風險。更重要的是,通用素材不具備獨特性,如果另一位影片創作者有相同選題、選擇了相同素材,我們的影片看起來就沒什麼區別了。

(“蒸汽機車駛過麥田”影片截圖)
當然,作為短影片創作者,我清楚一切目前的一切AI影片應用都存在侷限性,可靈AI也不例外:它一次生成的影片長度有限,無法一次性生成複雜的中長影片;生成速度有待提高,尤其是高畫質影片的生成耗費時間較長。但是這並不妨礙它成為一種有益的工具,幫助影片創作者大幅提升效率。而且,隨著時間推移,尤其是算力瓶頸的逐漸緩解,上面提到的問題都是可以得到解決的。
想象一下,技術進一步成熟後,我們可以用DeepSeek將影片創意轉化為文案和分鏡頭指令碼,再用可靈AI將前者轉化為完整影片,最後透過微調將其塑造為自己所需要的樣子。到那個時候,可靈AI這樣的影片生成應用內部或許將接入DeepSeek或者與之類似的強大文字模型,從而一站式地完成“從創意到成品”的任務。別誤會,這不會取消創作者的自主性,反而會讓創意更加值錢——絕大部分重複勞動被替代之後,剩下的是那些真正的閃光點!當一位創作者不用把大部分時間花在尋找素材、製作轉場特效上,他就可以集中精力去構思真正獨特而且感人的影片了。
毫無疑問,DeepSeek和可靈都是AI生產力工具。從生產力角度講,DeepSeek代表的是“左腦”:邏輯推理和結構化生成能力;可靈AI代表的則是“右腦”:多模態理解與生成能力。左腦和右腦連線起來才是一個完整的大腦,即人類的“第二大腦”。由“第二大腦”承擔大部分執行環節、幫助人類的“第一大腦”進行決策,將是AI時代人類工作的常態。關於DeepSeek所代表的“左腦”的市場潛力,市面上已經有很多分析了,毋庸贅述。而關於“右腦”的市場分析,卻還明顯不夠。
在此,我想問一個稍微小一些的問題:以可靈AI為代表的AI影片生成工具,其長期市場空間有多大呢?答案首先取決於國內短影片市場的規模。根據國家廣電智庫的統計,截止2024年,國內短影片使用者約為10.5億;各家諮詢機構對短影片市場收入規模的估算,則在3000-5000億人民幣不等(很可能還低估了)。假設數年之後,市面上10-20%的短影片時長由AI生成,或者至少由AI輔助生成,那就意味著每年數千億小時的使用者時長,對應500億乃至上千億的時長收入規模。AI生成工具能從這塊蛋糕中分走多少?現在難以精確估計,但數額總歸不會太小。
除了短影片,中長影片也將被AI深刻改變。還記得嗎?Sora釋出之後,許多電影從業者認為“電影行業將被AI深刻改變”,必須先理解改變趨勢才能進行下一步的計劃。快手副總裁蓋坤曾指出,可靈這樣的影片大模型在本質上是“世界模擬器”,是對世界表徵的複雜應用模型的建模。這就意味著,在遊戲、VR……等與“真實世界”相關的複雜生成賽道上,這樣的技術都將是不可或缺的,AI工具從中獲得的收入可能不低於短影片領域。我們不需要立即計算出一個結論,只需要知道市場的天花板很高就夠了。
8個多月前,當可靈大模型第一次釋出時,我的幾位網際網路行業的朋友不約而同地感嘆:“快手的基礎研發實力得到了證明。在影片生成賽道上,它組織起了一個具備戰鬥力的團隊,以自己擅長的方式取得了成果。”去年12月,谷歌釋出veo2影片大模型時,同時公佈了MovieGenBench基準資料集,這是一個人類評估者對影片生成質量的對比評估——表現最好的是可靈1.5,它也被谷歌定義為veo2最大的競爭對手;而Sora反而是主流影片生成模型裡表現最差的。這充分說明,在技術架構和資料層面,可靈就是世界先進水平。附帶說一句,當時谷歌測試使用的是可靈1.5大模型,而現在的可靈早已進化到了1.6。

(一條熱門推特:“中國AI產業決不只有DeepSeek……可靈是最好的影片生成模型”)
然而,在過去大半年的時間裡,資本市場和媒體在討論可靈AI的時候,往往也只是把它視為一個孤立的工具類應用,而不是快手生態的一個重要組成部分。在我看來,可靈對快手的重要性遠遠超出了單純的工具層面。首先,對於快手這樣的短影片+直播平臺來說,強大的AIGC工具的意義怎麼估計都不過分,能夠大幅充實內容生態、提高內容多樣性。
其次,可靈AI再次證實了快手的科技屬性:它不僅是一家消費網際網路公司,還是一傢俱備科技創新能力的公司。生成式AI是一個基礎研發主導的賽道,產品、運營都是錦上添花,唯有基座大模型能力是不可或缺的——這就是DeepSeek後來居上、超過諸多網際網路大廠自研大模型的原因,也是可靈AI超過許多資源更豐富的競爭對手的原因。可靈AI是一個縮影,體現了快手既重視基礎研發,也能夠做好基礎研發;在生成式AI方面如此,在其他方面可能也是如此。
可靈AI應該值多少錢?我們不妨以國際上的同類工具作為參考:影片生成領域最大的獨角獸Runway的最新一輪估值為40億美元,而影像生成領域(也是整個AI創意生成賽道)最著名的MidJourney的估值則為105億美元。此時此刻,快手的市值僅為約300億美元,去掉淨現金更是僅有280億美元。顯然,包括可靈在內的AIGC生態,尚未充分被納入快手的估值。而且,即便已經從年初的低點上漲約50%,快手目前的動態P/E仍然只有15倍,P/E/G也仍然低於1倍。不論在網際網路中概股當中,還是在全球消費科技類公司當中,這個估值都顯著低於平均水平。
今年年初以來,中國資產的價值重估邏輯無非是兩條:宏觀經濟尤其是內需的拐點,以及科技創新的蓬勃發展——快手的核心業務以及AIGC佈局,恰好對應著這兩點。雖然任何人都無法預測資本市場的短期波動,但是從長期邏輯看,這樣的快手迎來一波結構性的價值重估是完全合理的。