左腦DeepSeek，右腦可靈，或許是國產AI的“完全形態”

上個星期，我一直飽受流感困擾，完全無法更新影片號：既沒有心思撰寫文案，更沒有狀態出鏡。這卻給了我一個很好的機會，嘗試能否完全依靠目前高度發達的生成式AI工具，做一期像樣的短影片。我的選題是：“雖然AI大模型推理成本大幅下降，但算力需求反而更高了，就像當年蒸汽機的發明，反而推動了全世界的煤炭需求。因此，今後算力作為一種戰略資源的地位會更重要。”全長大約1分鐘。

我躺在沙發上，把這段話輸入了DeepSeek R1。它用了28秒，生成了包括畫面描述、配音以及轉場效果在內的全套文案：

【開場：蒸汽火車噴著白煙穿越金色麥田，鏡頭切換至晶片內部流光溢彩的電子流動】

（背景音樂：科技感音效與蒸汽朋克風格音樂交織。）

【畫面：老式蒸汽機活塞特寫→現代伺服器叢集閃爍藍光】

“1820年，瓦特改良蒸汽機後，英國煤炭消耗量反而暴增300%——效率提升永遠會激發更大需求！”

【動畫：AI大腦吸收海量資料流，形成算力黑洞】

“今天，AI大模型單次推理成本下降80%，但全球算力需求正以每年翻倍的速度狂奔！GPT-4處理一本《戰爭與和平》，只需要你喝口咖啡的時間。”

【資料視覺化：地球表面升起無數光纜，構成神經網路覆蓋大陸】

（音效：資料處理聲逐漸密集）

“每個智慧客服都在消耗一座小城市的算力，每輛自動駕駛汽車都是移動的超算中心，這，就是AI時代的‘煤炭悖論’！”

【畫面：稀土礦脈與晶片工廠交替閃現，最後定格在量子計算機冷卻裝置】

"當演算法進化遇上物理極限，算力戰爭已悄然打響。從矽基晶片到光子計算，從液冷技術到星鏈基站，21世紀最硬的通貨正在重新定義——”

【結尾：火箭發射升空，尾焰化作二進位制程式碼照亮夜空】

"記住：蒸汽時代屬於煤炭，電氣時代屬於石油，而正在展開的智慧時代，誰能掌握算力之源，誰就能點燃下一個文明紀元！”

（字幕彈出：算力即權力）

老實說，上述文案稍嫌煽情，但不是什麼大問題，稍微調整一下即可。根據我提供的簡短選題，能夠做出這樣一份文案已屬不易。問題在於，目前DeepSeek尚不具備多模態（圖片/影片/音訊）生成能力，所以影片生成環節必須交給別的AI工具。那麼到底交給誰呢？

我馬上想到了可靈AI。嚴格地說，快手於去年6月釋出的可靈大模型，是第一個真正“震驚世界”的國產大模型，也是第一個在應用水準上超過國外競爭對手的大模型——只需要看看當初它上線之後，國外AIGC圈子鋪天蓋地的評價就知道了。OpenAI的Sora雖然官宣時間更早，卻要等到六個月後才全面上線。在國產AI進軍世界先進水平的道路上，可靈是一個十分重要的里程碑，足以載入行業史冊。

由於可靈AI目前只能一次生成最多10秒的素材，所以我把上述文案拆分成六份，依次進行生成。不是所有片段都完全達到了我的預期，但其中至少有兩個讓我比較滿意：“蒸汽機車駛過麥田”，以及“稀土礦脈與晶片工廠的交替閃現”。要知道，我不是一個專業的AI創作者；倘若我更熟練一點，生成的影片質量肯定會更高，不過現在的成果已經夠用了。

如果沒有AI的力量，我就只能從網際網路通用素材庫當中尋找相關片段，不但很難找到合意的，而且難以規避版權風險。更重要的是，通用素材不具備獨特性，如果另一位影片創作者有相同選題、選擇了相同素材，我們的影片看起來就沒什麼區別了。

（“蒸汽機車駛過麥田”影片截圖）

當然，作為短影片創作者，我清楚一切目前的一切AI影片應用都存在侷限性，可靈AI也不例外：它一次生成的影片長度有限，無法一次性生成複雜的中長影片；生成速度有待提高，尤其是高畫質影片的生成耗費時間較長。但是這並不妨礙它成為一種有益的工具，幫助影片創作者大幅提升效率。而且，隨著時間推移，尤其是算力瓶頸的逐漸緩解，上面提到的問題都是可以得到解決的。

想象一下，技術進一步成熟後，我們可以用DeepSeek將影片創意轉化為文案和分鏡頭指令碼，再用可靈AI將前者轉化為完整影片，最後透過微調將其塑造為自己所需要的樣子。到那個時候，可靈AI這樣的影片生成應用內部或許將接入DeepSeek或者與之類似的強大文字模型，從而一站式地完成“從創意到成品”的任務。別誤會，這不會取消創作者的自主性，反而會讓創意更加值錢——絕大部分重複勞動被替代之後，剩下的是那些真正的閃光點！當一位創作者不用把大部分時間花在尋找素材、製作轉場特效上，他就可以集中精力去構思真正獨特而且感人的影片了。

毫無疑問，DeepSeek和可靈都是AI生產力工具。從生產力角度講，DeepSeek代表的是“左腦”：邏輯推理和結構化生成能力；可靈AI代表的則是“右腦”：多模態理解與生成能力。左腦和右腦連線起來才是一個完整的大腦，即人類的“第二大腦”。由“第二大腦”承擔大部分執行環節、幫助人類的“第一大腦”進行決策，將是AI時代人類工作的常態。關於DeepSeek所代表的“左腦”的市場潛力，市面上已經有很多分析了，毋庸贅述。而關於“右腦”的市場分析，卻還明顯不夠。

在此，我想問一個稍微小一些的問題：以可靈AI為代表的AI影片生成工具，其長期市場空間有多大呢？答案首先取決於國內短影片市場的規模。根據國家廣電智庫的統計，截止2024年，國內短影片使用者約為10.5億；各家諮詢機構對短影片市場收入規模的估算，則在3000-5000億人民幣不等（很可能還低估了）。假設數年之後，市面上10-20%的短影片時長由AI生成，或者至少由AI輔助生成，那就意味著每年數千億小時的使用者時長，對應500億乃至上千億的時長收入規模。AI生成工具能從這塊蛋糕中分走多少？現在難以精確估計，但數額總歸不會太小。

除了短影片，中長影片也將被AI深刻改變。還記得嗎？Sora釋出之後，許多電影從業者認為“電影行業將被AI深刻改變”，必須先理解改變趨勢才能進行下一步的計劃。快手副總裁蓋坤曾指出，可靈這樣的影片大模型在本質上是“世界模擬器”，是對世界表徵的複雜應用模型的建模。這就意味著，在遊戲、VR……等與“真實世界”相關的複雜生成賽道上，這樣的技術都將是不可或缺的，AI工具從中獲得的收入可能不低於短影片領域。我們不需要立即計算出一個結論，只需要知道市場的天花板很高就夠了。

8個多月前，當可靈大模型第一次釋出時，我的幾位網際網路行業的朋友不約而同地感嘆：“快手的基礎研發實力得到了證明。在影片生成賽道上，它組織起了一個具備戰鬥力的團隊，以自己擅長的方式取得了成果。”去年12月，谷歌釋出veo2影片大模型時，同時公佈了MovieGenBench基準資料集，這是一個人類評估者對影片生成質量的對比評估——表現最好的是可靈1.5，它也被谷歌定義為veo2最大的競爭對手；而Sora反而是主流影片生成模型裡表現最差的。這充分說明，在技術架構和資料層面，可靈就是世界先進水平。附帶說一句，當時谷歌測試使用的是可靈1.5大模型，而現在的可靈早已進化到了1.6。

（一條熱門推特：“中國AI產業決不只有DeepSeek……可靈是最好的影片生成模型”）

然而，在過去大半年的時間裡，資本市場和媒體在討論可靈AI的時候，往往也只是把它視為一個孤立的工具類應用，而不是快手生態的一個重要組成部分。在我看來，可靈對快手的重要性遠遠超出了單純的工具層面。首先，對於快手這樣的短影片+直播平臺來說，強大的AIGC工具的意義怎麼估計都不過分，能夠大幅充實內容生態、提高內容多樣性。

其次，可靈AI再次證實了快手的科技屬性：它不僅是一家消費網際網路公司，還是一傢俱備科技創新能力的公司。生成式AI是一個基礎研發主導的賽道，產品、運營都是錦上添花，唯有基座大模型能力是不可或缺的——這就是DeepSeek後來居上、超過諸多網際網路大廠自研大模型的原因，也是可靈AI超過許多資源更豐富的競爭對手的原因。可靈AI是一個縮影，體現了快手既重視基礎研發，也能夠做好基礎研發；在生成式AI方面如此，在其他方面可能也是如此。

可靈AI應該值多少錢？我們不妨以國際上的同類工具作為參考：影片生成領域最大的獨角獸Runway的最新一輪估值為40億美元，而影像生成領域（也是整個AI創意生成賽道）最著名的MidJourney的估值則為105億美元。此時此刻，快手的市值僅為約300億美元，去掉淨現金更是僅有280億美元。顯然，包括可靈在內的AIGC生態，尚未充分被納入快手的估值。而且，即便已經從年初的低點上漲約50%，快手目前的動態P/E仍然只有15倍，P/E/G也仍然低於1倍。不論在網際網路中概股當中，還是在全球消費科技類公司當中，這個估值都顯著低於平均水平。

今年年初以來，中國資產的價值重估邏輯無非是兩條：宏觀經濟尤其是內需的拐點，以及科技創新的蓬勃發展——快手的核心業務以及AIGC佈局，恰好對應著這兩點。雖然任何人都無法預測資本市場的短期波動，但是從長期邏輯看，這樣的快手迎來一波結構性的價值重估是完全合理的。