
頭圖由豆包生成 提示詞:拿著手機刷短抖音影片
作者
|summer
郵箱
“AI還能這麼玩?”
當你開啟抖音,一連劃過幾條影片,你可以聽到東北小貓唱著說著貫口和段子,潮流小貓唱著最新的rap和 APT,抑或是一位貓界鄧麗君深情獻唱一首經典華語歌曲。

而下一秒,你可能就會刷到甄嬛傳的片段被AI對口型配音後的魔改劇情。

再往下,一段普通人的英語口語朗讀影片,配上AI打分特效,瞬間成了口語學習小課堂。

網友們玩得不亦樂乎的同時,AIGC正在以最輕量、最日常的方式,滲進普通人的生活。
站在網際網路使用者的視角,這是技術再一次對使用者內容生產的賦權,無需下載複雜的應用,無需學習專業的操作,只消點選一個特效按鈕,任何人都能體驗AI帶來的新奇與樂趣。
但對AI產品開發者而言,這卻是一個略顯尷尬的轉折:許多精心打造的獨立應用,最終都淪為了短影片平臺的轉瞬即逝的特效功能。
但這或許才是這些AI應用本身應該存在的方式。
1
任何一款AI應用火了,都將淪為抖音特效?
開啟抖音搜尋“英文口語測試”,一個個使用者對著鏡頭朗讀英語短文的影片鋪滿了螢幕。
有人自豪地曬出自己的標準英文口語,被AI認證為美國、英國口音,也有人充滿喜劇效果地念著一串磕磕絆絆的英語,透過AI證明了自己“純血中國人”的身份,更有趣的是那些AI判定出人意料的結果,讓網友直呼:“為什麼AI說我的英文是咖哩味的?”

就是這樣一個集趣味性和社交屬性於一身的特效,截至目前已有接近30萬人參與投稿,累計了超2億的播放量。
這股熱潮並非偶然。就在前幾周,社交媒體上剛剛掀起了一波對AI口語練習應用Boldvoice的討論。兩者的病毒傳播路徑驚人相似:都是透過AI口音識別這個新奇賣點,讓使用者自主傳播擴散。

Boldvoice的核心功能是讓使用者朗讀一段英文,快速獲得發音分析和母語背景判斷。這個測試環節吸引了大量國內英語學習博主和各籍外國友人競相轉發測試結果。
不同的是,Boldvoice本質是一款教育產品,測試後有AI即時識別和專業教練影片教學,幫助使用者改善口語水平,付費訂閱為600元一年,讓不少人望而卻步;相比之下,抖音特效版本雖然準確度和專業性大打折扣,卻因為其社交性和免費屬性獲得了更廣泛的傳播。
從Boldvoice到“英語口語測試”特效,揭示了一條特效創作的新路徑:發掘小眾圈層中正在發酵的AI應用場景,將其簡化為輕量級特效,從而實現更大範圍的病毒式傳播。
這一打法並不是個例。開啟特效排行榜,已經可以看到各類AI應用的“簡化版”如雨後春筍般湧現:從最初的AI換臉、AI寫真,到如今的AI配音、AI取名、AI編曲,這些曾經小範圍出圈的獨立AI應用,都能在抖音特效庫裡找到它的“壓縮版”,且已經進入特效投稿總排行榜的前列。

例如,在最近的Tiktok Refugee熱潮下,不少網友打起了“用AI給外國人取中文名”的主意,而抖音很快就出現了人臉識別看看你適合什麼中文名的互動特效;那些需要收費的AI寫真應用,Recraft的拍立得HelloKitty、Remini的粘土特效、Pixverse的毒液特效,都可以被抖音簡化為一鍵式的藝術風格轉換,輕點按鈕把自拍變成賽博朋克風或二次元風格。

還有各類複雜的AI音樂創作工具,在抖音只需要上傳幾張圖片,AI就能在幾秒鐘的時間內識別內容,基於所識別的內容進行作詞、作曲,並製作出一個音樂影片作品。

類似的“降維”現象正在AI應用領域不斷上演。
更值得關注的是使用者的使用行為。在這些影片的評論區,經常能看到這樣的留言:“這個太好玩了!”“我願稱之為2024最佳特效”“這個怎麼用?”……使用者們的關注點很少在AI技術本身,而是把它當作一個有趣的玩具,一個能讓影片更吸引人的工具,這也恰恰反映了C端大眾對AI的真實需求——簡單、直接、娛樂性強。
從產品形態來看,這些AI特效相較產品確實失去了一些專業性和細節度,但卻因此獲得了更廣泛的傳播。它們不再是獨立的“孤島”,而是融入了短影片這個龐大的內容生態,藉助平臺既有的社交屬性和傳播機制,實現了更快速的市場滲透。
1
為何是特效,而非應用?
從抖音的生態格局來看,特效成為了AI能力落地的最優解。
抖音以短影片起家,構建了一個龐大的內容消費生態。每天數億使用者需要消費海量新鮮內容,而AI特效恰好能降低創作門檻,讓普通使用者也能輕鬆製作有趣內容。在當前階段,文生圖、文生影片作為一種"恰到好處"的娛樂工具,既滿足了使用者的創作需求,又契合平臺追求"好玩"的調性。
從技術實力看,抖音的AI團隊是整個位元組系中最為神秘的,但其技術實力在特效中得到了充分體現。不同於豆包的通用大模型、飛書的協作型AI,抖音將生成式AI能力巧妙融入特效。以官方特效“AI新年單曲”為例,透過涵蓋圖片理解、歌詞創作、歌曲生成、影片製作等能力,在數秒內形成了一個作品質量讓不少網友驚歎"比流行歌曲還好聽"的歌曲影片。
而作為一個國民級短影片平臺,與獨立應用不同,抖音也面臨著特殊的技術挑戰:即如何在儘可能小的算力、流量消耗下,快速生成作品。過去,抖音特效為了讓方便使用者下載使用,基本都要求包體積控制在8M以內。以2022年的"AR中國年"特效為例,在融合了深度學習、SLAM與圖形渲染等多個演算法模組的背景下,技術團隊透過AutoML尋找緊湊模型結構,結合剪枝、非結構量化等壓縮演算法,以及低位元結構化量化,最終在保證演算法精度的前提下將特效控制在合理體積內,確保使用者能快速載入使用。這種在有限空間內實現複雜AI能力的技術能力,成為抖音AI特效的核心競爭力。
除了官方製作,更重要的是抖音還透過一系列機制構建了完整的特效創作者生態。專門的特效製作工具"橡塑APP"降低了創作門檻,AI特效排行榜提供了展示平臺,數千元的成長任務獎勵與節慶限時投稿活動(如蛇年特效)則持續激勵創作。由此,特效創作、內容生產、流量分發形成了自我強化的良性迴圈,讓AI特效持續為平臺創造價值。
對創作者而言,相比燒錢買流量,製作特效獲得平臺流量激勵或許成了更具吸引力的選擇。
表面上看,將AI應用簡化為抖音特效似乎是一種“降維”,但這種轉變也帶來了一個疑問—— 如果一款AI應用不如作為一個“特效”獲得更大的傳播價值,那麼它作為獨立應用存在的意義是什麼?
從資料看,AI應用正在快速增長。QuestMobile資料顯示,2024年12月AI原生App月均使用時長達133分鐘,較1月增加53.4分鐘,使用次數從26.1次增至49.6次。
但細分來看,綜合類通用類的應用差異化低,且呈現明顯的二八格局,豆包、Kimi、文小言佔據80%流量;而垂類應用為了避開大廠競爭,從小場景出發,追求強付費、高粘性但卻由於場景過窄,始終未能出現千萬級使用者量產品,且使用頻率、留存率都不高。
以AI起名、AI寫真(如妙鴨、Recraft)為例,這類應用往往難以突破低頻使用的天花板:普通使用者可能一生就用那麼一兩次起名服務,再玩味十足的AI寫真,新鮮感一過也很難讓使用者持續付費。再小眾的賽道也充滿了同質化產品,加上低頻特性,讓這類應用很難建立持續的使用者關係,更遑論形成有效的商業模式。
而作為“AI應用工廠”的字節跳動,正透過雙重路徑重塑AI應用:一方面是位元組以豆包大模型為基礎不斷孵化新的AI應用,另一方面是抖音團隊基於自身的場景,不斷嘗試將AI功能轉化為抖音生態內的創作工具,透過使用者創作和消費AI內容,再以流量激勵特效製作者(如橡塑APP新人獎勵30元),加強內容生態的迴圈。
這種特效化轉型也恰恰規避了獨立應用的幾大痛點:降低獲客成本,解決使用者留存難題,並將低頻需求轉化為內容創作素材。
這或許啟示我們,AI應用的形態並非只有傳統獨立APP一條路。在技術日趨同質的當下,找到合適的應用場景,比追求完整的產品形態更重要。
與其自己造一個,不如加入一個生態。
