晚點獨家丨快手提高可靈AI的優先順序,組建一級部門

可靈的下一步:優先保證模型效果、聚焦專業生產者做滲透。
高洪浩
《晚點 LatePost》獨家瞭解到,快手在今日成立了可靈 AI 事業部。該事業部下設可靈 AI 產品部、運營部和技術部,負責可靈、可圖等系列大模型業務,快手高階副總裁蓋坤擔任可靈 AI 事業部負責人,繼續兼任社群科學線負責人。
與此同時,社群科學線下成立基礎大模型與應用部,負責 LLM 大模型、多模態理解大模型以及應用技術研發。
調整後,可靈 AI 將作為與主站、商業化、電商、國際化、本地生活並列的一級業務部門,向快手董事長兼 CEO 程一笑彙報。這也是近 3 年時間裡,快手唯一成立的獨立事業部。
可靈與可圖分別是快手自研的影片生成大模型與圖片生成大模型。2025 年 3 月 25 日的快手財報電話會上,快手 CEO 程一笑稱,目前可靈 AI“圖生影片” 功能的綜合效果處於全球第一。
根據官方資料,自商業化以來至今年 2 月,可靈 AI 累計營業收入已超過 1 億元。我們瞭解到,可靈 AI 今年前三個月的營收,已超過 2024 年下半年的總和。
一位快手人士稱,AI 一直是快手的公司級戰略,此次組織升級,意味著可靈 AI 在快手大模型整體戰略中的重要性進一步提升,團隊能更靈活地發展業務、獲取並調動更多的資源,以保持在視覺大模型領域的競爭優勢。
快手不是國內第一家將 AI 業務升格為一級部門的網際網路公司。2023 年底,字節跳動組建了獨立於原有組織架構的新部門 Flow 和 Seed,前者做 AI 產品,後者做大模型研發。
另據我們瞭解,就在此次組織架構調整公告發布之前一週,快手內部員工已收到了可靈 AI 的內推及 “活水” 通知,招聘的崗位涵蓋研發、演算法工程、產品、運營及商務合作等多個職位。
一位快手戰略人士告訴我們,內部對可靈有很大的期待。在最近的一次內部幹部會上,蓋坤提到,可靈在發展路徑選擇上要優先保證模型效果,並聚焦 P 端使用者(professional creators),要求可靈能在 AI 視覺生產領域可以做到 “全球領先”。他還多次表達了,希望能用 AI 把《三體》的場景復現出來的想法。
快手 CEO 程一笑此前在財報電話會上也提到,AI 大模型有機會極致降低內容創作的門檻和成本,並帶來 AIGC 內容生產數量和質量的爆發式增長,從而形成新的商業模型。
瞄準一個方向,更堅決的投入
快手是押注影片模型最堅定的中國網際網路公司之一。
據我們瞭解,快手在 2023 年初啟動 AI 戰略並制定了相應目標規劃。當年 3 月底的內部幹部會上,程一笑便提及,AI 是個新時代,對快手來說,推薦和影片生成領域是發力點。“在下一個十年想在風口找到自己的位置,要做長期而正確的事。” 一位在場的快手人士轉述他的話。
在 2023 年以來的 9 次幹部會上,AI 始終是最高管理層反覆強調的重點話題。“一笑關注 AI 如何賦能現有生態,也提出要加快 AI 創新業務的發展節奏。”
2023 年下半年,快手成立專項,探索影片生成技術。次年 2 月,OpenAI 的 Sora 問世,快手進一步向影片生成傾斜開發資源,並很快被定為了公司級戰略。一位可靈人士告訴我們,程一笑經常關注可靈的業務發展情況,還要求公司優先保障可靈的 GPU 供給。
當時多數網際網路公司的重心都在應用前景更明朗的大語言模型和圖片模型上。即便 Sora 讓行業看到了影片模型的潛力,“但優先順序依舊沒提高多少。” 一位字節跳動大模型研發人士說。
百度 CEO 李彥宏就曾公開稱,不會投入影片生成模型,他認為從長期來看,影片模型無法帶來收益;字節跳動則把多模態的優先順序放在了視覺理解和圖片模型上;在騰訊,文字模型也一度被認為更重要,“因為這是任何產品都能用上且需要的能力。” 一位混元大模型研發人士說。
2024 年 6 月,可靈大模型上線,這是全球第一個與 Sora 一致採用 DiT 路線,且直接面向普通使用者開放的影片大模型。“完全沒想到是快手最先做出來。” 上述字節跳動大模型研發人士說。
除了較早開始堅決投入,可靈能迅速嶄露頭角也得益於組織優勢。
可靈大模型是由快手社群科學線的團隊開發的,其中許多成員原本的日常工作就是處理千萬量級的影片內容,包括對影片的畫質和內容做分析、標註等,而在做大模型時,“這種能力和工作流程是可以直接複用的。” 一位可靈人士說。比如,團隊只花了很短的時間便完成了訓練資料的規範化處理,並按照需求篩選整合至訓練集中。
相比之下,在不少公司裡,研發大模型的團隊多是新組建的,他們得先花大量時間從零搭建資料處理的管線、重新打磨演算法和工程效率。一位頭部網際網路公司影片模型研發人員告訴我們,團隊組建好後,僅將每日處理的影片資料量從 1000 萬提升至 2000 萬,就耗費了大半年時間。
根據 AI 基準測試機構 Artificial Analysis 釋出的全球影片生成大模型榜單,快手可靈 1.6pro(高品質模式)以 1000 分的 Arena ELO 基準測試評分登陸圖生影片(Image to Video)賽道榜首,Google Veo 2、Pika Art 位居榜單第二、三名。
一位 AI 創業者稱,在各家公司豪擲大模型資源 “軍備” 的階段,快手選擇了一條更能發揮出自身稟賦的賽道並專注投入,這是明智的選擇。
長跑才剛剛開始
創立於 2011 年的快手最早是一款 GIF 動圖產品。2013 年轉型為短影片平臺後,快手的日活躍使用者數在一年時間從萬級上漲到了百萬級。
可靈的出現讓快手看到了,在 AI 時代復刻這個成功路徑的可能性。
2025 年 4 月 15 日,面世不到一年後,快手釋出了可靈 2.0 影片生成模型及可圖 2.0 影像生成模型。快手高階副總裁、社群科學線負責人蓋坤在釋出會上稱,兩款模型在團隊內部的多項勝負率評測中,均穩居業內第一。比如在文生影片領域,可靈 2.0 對比谷歌 Veo2 的勝負比為 205%,對比 Sora 的勝負比達 367%。
不過一位快手人士稱,內部對於將可靈打造為一個超級入口並不著急,目前最重要的任務還是將資源投入到研發上,保持可靈大模型和可靈 AI 在技術與產品上的領先,“畢竟以市面上各個影片生成模型的能力來看,它們連數字媒體市場 20% 的份額都吃不下來。”
各公司對於什麼是 AI 時代超級入口也尚無共識。在字節跳動,由抖音集團原 CEO 張楠帶隊的 AI 創作平臺即夢,其遠期規劃與快手類似——打造一個 AI 時代的抖音。
一位即夢人士稱,內部判斷,至少還要再等 3-5 年才可能找到 AI 影片平臺真正應有的形態。據我們瞭解,如今市面上的一眾影片生成應用,30 日的使用者留存率普遍在 4%-5% 的低水位。“產品的使用者仍然侷限在有創作需求的人,以及 AI 愛好者們。”
對快手來說,復刻一個 AI 時代的快手,也有很現實的挑戰。一位深入研究 AI 的二級市場人士告訴我們,目前的主流 AI 產品如果服務 1 億日活使用者,需要約 40 萬張卡的算力,這大約對應十個新的算力中心。對多數公司來說,這是一筆不小的開支。

一位快手人士說,今年 3 月,蓋坤在可靈 2.0 釋出前的公司幹部會上強調了 “保持模型效果持續領先” 的重要性,同時在營收規模上,也提出了 2025 年要實現 “跨越式增長” 的目標。

在這場長跑式的競爭裡,快手要保證可靈的模型能力和 “造血” 能力的始終領先,這並不容易。
目前行業內對影片模型的技術路線仍存在爭議。一位字節跳動 Seed 人士稱,當前影片生成技術雖與文字模型使用相似的底層架構,但缺乏對內容的真正理解能力。
可靈 2.0 模型釋出會上,蓋坤也表達了類似的觀點,“儘管 AI 在輔助創意表達上擁有巨大潛力,但當前的行業發展現狀還遠遠無法滿足使用者需求。” 他當時提出了一個新的影片生成的互動理念 Multi-modal Visual Language(MVL),稱希望使用者可以藉此更自由地引入文字、圖片、影片等多模態資訊,生成符合想法的創意影片。
無論如何,“可靈還是帶給了快手久違的興奮感和戰鬥力。” 一位快手人士說,“影視、廣告和網際網路行業裡,可靈都在加速滲透。”
十二年前,快手從 GIF 社群轉型短影片社群,抓住了移動網際網路時代的機會,如今成為了中國總流量排名第三的應用程式。“在一笑看來,AI 是一次全新的起點,大機率將再次給各公司與產品帶來躍升的機會,這是快手一定要抓住的。” 上述快手人士說。
題圖來源:《大都會》
 FIN 

相關文章