快手昨天釋出了2024年第二季報:營業收入同比增長11.7%,調整後淨利潤同比增長73.7%;二者均大幅超過了市場一致預期。快手的MAU(月活使用者)、DAU(日活使用者)和使用者時長仍在增長,無論是使用者資料還是營收利潤資料——相信這都是一份讓資本市場無可指摘的財報。。
不過,相比單純的財務數字,我最關心的是生成式AI的表現,它將決定包括快手在內的一切網際網路內容平臺的未來。我加入了好幾個AIGC交流群,其成員基本全是AIGC技術或產品方向的從業者,要麼就職於網際網路大廠,要麼在自己創業。自從今年6月以來,“可靈”就成為了這幾個群裡最熱門的關鍵詞之一。試按照時間順序摘錄一下:
-
6月7日:“快手可靈開放測試了!”“這麼牛?”“牛!”(這樣的隊形大約保持了十幾樓)“唯一的缺憾是不能圖生影片。”(這個遺憾很快被補上了) -
6月27日:“求認識可靈的同學,有沒有商用API?我們這邊有大量需求。”(可惜當時沒有,提問的人還很失望) -
7月14日:“我全程使用可靈做了一個動畫故事,感覺把概念動畫全部交給可靈,是很可行的。”(發言者為國內某頭部遊戲美術)“大佬威武!”(群友的回覆) -
8月6日:“可靈不僅是國內目前效果最好的文生/圖生影片大模型,而且是唯一真正成熟的,其他都是半成品,沒法比較。”(請注意,此時離可靈釋出已經過去兩個月了)
時至今日,可靈仍然是全球範圍內少有的效果領先且真正具備實用價值的影片生成大模型。作為一個還算成功的影片創作者,我雖然還沒有全面擁抱AIGC,但一直在關注其進展。就在昨天下午,我還用可靈生成了一段貓咪在紙箱裡玩耍的影片,並與自家貓咪的真實影片進行了對比。對我而言,目前可靈最大的缺憾是單次只能生成10秒影片,當然,對於分鏡拆分已經非常專業的那部分作者來說,單次10S長度已經可以滿足需求;但對現階段的我來說,如果可靈未來的升級可以支援單次生成更長的影片,想必屆時我會非常樂意依賴AI進行日常影片創作。
任何稍有影片創作經驗的人,應該都能意識到可靈這樣的AIGC工具的革命性意義。影片創作的兩大基礎是文案和素材,基本創作流程就是先撰寫文案,再在此基礎上實拍或尋找素材。要把素材和文案天衣無縫地結合起來,真是一個高難度任務!各大影片平臺都會向創作者提供龐大的素材庫,但那是遠遠不夠的。那些“機構化”創作者(例如MCN)固然可以砸錢拍攝或採購更高質量、更貼合文案的素材,可是廣大PUGC創作者怎麼辦呢?他們才是短影片平臺的創作主力軍,離開了他們,任何平臺的內容生態都會變成無源之水、無本之木。
從這個角度看,可靈這個AI工具與快手這個平臺還真是絕配:快手一貫以使用者和內容的“全覆蓋”著稱,其slogan是“擁抱每一種生活”。數以百萬計、身份背景各異的老鐵們的奇思妙想,是快手內容生態的靈魂。過去多年,一批又一批的全網熱梗都是起源於快手老鐵UGC的靈光一閃,然後才被其他平臺拼命仿效,從而“出圈”。作為國內最早的短影片平臺之一,快手曾經把影片創作的渠道或曰發言權“下放”到了千千萬萬的創作者手中;現在,它又透過可靈,把高效的影片創作工具“下放”到了千千萬萬的普通人手中。
我相信,對於那些不以快手為主要釋出平臺的影片創作者而言,過去兩個月的一個常規操作就是:下載快影(快手官方的影片創作工具),申請可靈測試資格,然後體驗與可靈深度融合的快影創作工具。當然,現在可靈推出了Web版,可以直接使用了,但與快影結合使用的效果還是更好一些。經過一段時間的體驗,他們當中肯定會有人嚴肅考慮,要不要把快手作為自己的創作主陣地之一。就拿我自己來說,雖然在快手進行創作至今已有三年,可是在試用可靈之前,它只是我釋出內容的眾多平臺之一;而在試用可靈之後,它在我心目中的地位日益重要,或許會成為最重要的釋出平臺。這就是AIGC對快手內容生態的擴充作用的一個縮影!這種擴充是全面的、持續的,其影響才剛剛體現出來。
上面說的都是內容創作層面。其實,AIGC的革命性影響,更多地體現在商業化層面。這一點,在AIGC風潮的發源地——矽谷,已經得到了充分體現。例如,在剛剛釋出的二季報當中,谷歌驕傲地宣稱:Verizon(北美最大的電信運營商)與YouTube創作者的“AI共創影片”,可以針對不同觀眾顯示不同長度、不同側重的廣告影片;在這一系列影片中,Verizon的成本(CPA)比平時降低了15%,轉化率提升了38%。谷歌和Meta (Facebook)的管理層都樂觀地認為,在生成式AI徹底成熟之後,廣告主可能只需要向平臺提供宣傳目標和預算,由AI去完成從創意到執行的整個過程。這一天離我們應該不會太遙遠!

快手的二季報也對“AI助推商業化”這個主題進行了濃墨重彩的描述:“我們的AI矩陣已經無縫嵌入多個業務場景,支援內容創作、內容推薦與理解和使用者互動。在2024年6月,來自營銷客戶的AIGC營銷素材日均消耗達2000萬元人民幣。”而在財報電話會議上,快手CEO程一笑進一步指出,“我們更加關注大模型在商業化場景的應用。基於快意大模型構建的影片和直播指令碼生成、廣告線索客服,疊加數字人技術,助力商業化廣告主低成本生成高品質的影片和直播內容,提升線索轉化效率。”
程一笑已經描述的很清楚了:快意(基礎大語言模型)、可圖(圖片生成模型)、可靈(影片生成模型),共同構成了覆蓋整個廣告創作流程的一體化AIGC解決方案。商家可以用快意生成文案,在此基礎上用可圖生成圖片,再用可靈完成圖生影片的任務——這種一體化的生成路徑,會讓最後產生的內容具備更強的延續性、更符合預期。這還不算完,在內容分發環節,無論是普通內容還是廣告這樣的商業化內容,都可以得到推薦大模型的賦能,讓推薦結果更符合使用者的口味;對於商家而言,這就意味著更高的廣告轉化率!
看到了嗎?谷歌和Meta提出的“廣告主只需要提供目標和預算,由AI去完成整個過程”,這個理念在快手已經初具規模、開始落地了。如果廣告主發現快手的“AI一體化解決方案”能夠帶來更低的成本和更高的效率,他們必然會更傾向於在快手投放,乃至將整體業務向快手平臺靠攏。迄今為止,當我們討論快手對品牌和商家有何獨特價值時,提到最多的往往是“公私域結合”的流量分配機制,對各層級使用者(尤其是下沉市場)的全覆蓋,以及內容調性的多元化,等等。從今往後,AI可能會成為一個同樣舉足輕重的理由,甚至成為快手對廣告主的核心優勢。當然,這個過程不會是一蹴而就的,現在還僅僅是一個開始。
在本文的最後,我還想提出一個耐人尋味的問題。自從可靈釋出之日起,我周圍的很多人(包括我自己)就一直在提出這個問題:為什麼是快手首先拿出了這樣一個大模型?
在技術路線、算力資源和訓練資料均不存在代差的情況下,關鍵的區別可能在於工程層面。說到底,生成式AI研發99%的問題是工程問題,尤其是如何妥善地組建和管理團隊從而完成任務的問題。不要小看這個問題,谷歌的Gemini大模型就是在工程管理上出現了嚴重漏洞,才導致不斷延期,成品釋出之後還因為獎勵模型(負責與人類價值觀對齊)的問題而鬧出醜聞。我的個人猜測是,快手高效地、富有技巧地完成了訓練層面的工程任務,相對於競爭對手取得了至少幾個月的先發優勢。
更進一步地說,大模型技術畢竟還在迅速演進之中,尊重技術是很重要的。我們不能抱著做傳統網際網路產品的心態去做大模型,而需要在技術和產品兩端之間找到平衡;上面提到的工程問題,本質上也是技術問題的一個分支。按照我的一位朋友的說法,“快手對頂尖技術人才非常慷慨。與競爭對手相比,目前快手反而成為了比較精幹靈活的一個,這一點在生成式AI研發上體現得尤其明顯。”附帶說一句,這位朋友並不就職於快手,純粹是站在旁觀者的角度有上述感嘆。
總而言之,包括可靈在內的快手生成式AI工具的成功,既證明了管理層的戰略眼光,也是快手組織執行力的一個極好的體現。至於這個組織執行力的優勢到底有多大?不好說,但我想指出的是:只有競爭對手還無法推出能夠與可靈相匹敵的工具,快手的優勢就會維持並擴大,從而逐漸形成量變到質變的效果。我們正在目睹這個過程!