行業觀察|抖音又對演算法下手了

可信任演算法正在繭房消解上發揮重要作用,作為一個日均更新為億數量級的影片平臺,抖音進化演算法的動力更加迫切
文|施然
短影片平臺已經是人們生活中不可或缺的一部分,平臺使用者量超過10億,但流量與演算法之間的關係一直是一個神秘黑箱。
今年1月,國內短影片平臺抖音宣佈,將推出10項措施,推動平臺工作透明化,和演算法向上向善。3月30日,抖音安全與信任中心網站(95152.douyin.com)上線試執行,網站面向社會公開抖音演算法原理、社群規範、治理體系和使用者服務機制。
這個網站的特別之處在於,它是行業裡首次公開推薦演算法原理的平臺,介紹其推薦演算法如何預估使用者行為機率,並透過多目標建模等方式來實現更優質、豐富的內容推薦。而演算法需由平臺治理體系對其進行約束和規範。網站也披露了抖音平臺治理的稽核流程,闡述平臺如何應對謠言、網暴等違規內容帶來的挑戰。
關於演算法的討論中,“資訊繭房”是對演算法機制最直接的攻擊。
“資訊繭房”最早出現在凱斯·桑斯坦的《資訊烏托邦》書中,是對部落格時代“友情連結”功能帶來觀點單一的擔心。在當下環境中,“資訊繭房”已成為網路常用語,但含義已經發生變化,更多是用於描述資訊同質化等現象。一些人認為,內容平臺在推薦演算法加持下,只給使用者推送他們喜歡看的內容和觀點,因而導致個體使用者會處於“資訊繭房”中。但這並非事實,“資訊繭房”對於平臺、使用者和創作者來說都會帶來傷害。
使用者抗拒資訊繭房;一些創作者希望自己的內容能夠被更多人看到,而不是永遠停留在固定的使用者圈層裡;平臺同樣不喜歡,抖音實踐發現,儘管多樣性的推薦內容可能會在短期減少使用者活躍度,但長期隨著時間積累,演算法會幫使用者探索出更多興趣,帶來更多使用者長期價值,因此抖音也想打破“資訊繭房”。
從技術視角看,這是推薦的精準性和多樣性平衡的命題,需要在保證內容推薦效率的同時,不斷調整推薦方向和節奏。因此,演算法最佳化並非一蹴而就,需要長期持續最佳化調整,而演算法公開是關鍵一步。抖音不斷調整最佳化價值模型,希望實現內容、使用者、作者以及平臺的多方價值共贏。
抖音演算法主動打破“繭房”:推薦給朋友、不感興趣、遮蔽關鍵詞頁面。圖源:抖音安全與信任中心官網
為引導演算法打破“資訊繭房”,抖音演算法在多目標建模體系下設定專門的探索維度:一是針對使用者已展現出的興趣,透過多樣性打散、多興趣召回、扶持小眾(長尾)興趣等方法,控制相似內容出現頻次,推薦更多樣的內容;二是幫助使用者探索更多新興趣,採用隨機推薦、基於社交關係拓展興趣、搜尋推薦聯動、“不感興趣”不再展現等多種方式,讓使用者主動行為影響推薦系統,使推薦更加個性化和多樣化。
爆款與演算法
移動網際網路時代,演算法必不可少。在電商平臺上,演算法不僅為使用者推薦商品,在商品配送和供應鏈環節都發揮作用。在外賣平臺上,演算法要結合天氣、高峰時間段和交通等多重因素,最佳化業務鏈條。
抖音平臺上有大量使用者和內容,更需要推薦演算法。抖音演算法工程師劉暢近期在與我們交流時介紹,抖音每一天的內容投稿量為億數量級,但一個使用者一天能觀看的內容大約平均幾百條,因此抖音需要很強的分發效率,才能夠讓使用者找到自己感興趣的內容,同時也能把內容分發給合適的使用者,讓使用者和創作者都能在平臺上有不錯的體驗。
從外界視角來看,抖音上會出現郭有才等素人快速走紅的“大爆款”內容。一些人認為,這是“平臺造神”的結果,即平臺為了保持流量熱度不斷推出新網紅。
從實際操作的視角看,平臺沒有動力和意願去“造神”,也沒有能力隨便捧紅一個人。此外,社交媒體平臺普遍具備“去中心化”特徵,使用者不僅是資訊接受者,也會用觀看、點贊、評論等行為表達自己的偏好。這些內容偏好被演算法捕捉後,才會被推薦給更多人。這種“去中心化”的推薦機制,實現了“使用者對使用者的推薦”,平臺無法將全部流量集中到某個創作者,無法隨意地將其打造成“神”。
中國人民大學新聞學院釋出報告稱,媒體報道、熱搜是網紅“出圈”關鍵。報告對抖音網紅漲粉數進行迴歸分析發現,是否上熱搜能夠顯著影響網紅的30天內漲粉情況,即上熱搜能夠助推漲粉並實現破圈傳播。與此同時,一些抖音單月漲粉超過500萬的創作者,如生活劇情博主“大圓哥”、母嬰育兒博主“朱兩隻吖”,由於沒上過熱搜,缺乏主流媒體報道,則未能觸及更廣泛的圈層、為大眾所熟知。
短時間內走紅的網紅,或是新聞事件當事人,或有特殊的內容稟賦,具有不可預測性。藝人經濟公司很難靠砸資源捧出真正的大明星,網紅也沒有明確的“造星”路徑。一家頭部MCN機構創始人認為,“頭部網紅自身有很強的特質,這是他的核心競爭力,一家機構再厲害,也複製不了李佳琦這樣的網紅。”此外,如果演算法想捧誰就捧誰,平臺可能會因此受到“反噬”,與某些網紅的深度繫結,也容易為平臺帶來內容風險。

推薦演算法原理
推薦演算法的工作流程,一般包含召回、過濾、排序等環節,重點是學習使用者行為。
使用者每次重新整理,推薦演算法啟動的第一步是召回,即從候選內容池中快速撈取可能感興趣的內容。然後,深度學習演算法基於使用者的歷史行為,給每個使用者形成一套專屬的價值模型,模型會預測使用者對候選影片的行為,結合使用者行為和影片本身的價值權重,推算出影片推薦的價值分數,並將綜合得出的價值最高的影片推送給使用者。
這個估算價值的模型,隨著演算法的進步,已近乎即時調整,使用者每次動作,演算法都會根據使用者實際動作調整自己的引數,對各類價值重新加權,以更好滿足使用者需求。
演算法是工具,是為解決使用者需求,打分的最終目標是使用者長期價值。在那場交流中,劉暢提到,長期價值是抖音演算法的“北極星指標”,而不是短期資料,“如果我們比較關注短期資料,那就會強化像點贊、完播這些短期好收集的訊號,但如果我們關注使用者的長期價值,我們就會看他對某些作者長期的一些互動,比如會不會經常去收藏某些內容,這些內容才是使用者對平臺長期認可的方式。”
演算法基於使用者行為推薦,對可能發生的使用者行為預測打分。圖源:抖音安全與信任中心官網
比如,抖音平臺上有一條長達450分鐘的紅樓夢解析影片,播放量超過3億。在短影片平臺,這條影片實在是太長了,長影片有一個特點,完播率大幅低於短影片。但從播放量看,這條影片的播放量是很好的。過去,不少人認為,完播率是演算法推薦的核心權重,如果很少使用者能夠看完這條影片,演算法可能會判定為低質量內容,不會推薦。這是片面的觀點,這條450分鐘的長影片的分享量、評論量和收藏量都很高,在多維度的打分標準下,得到了平臺演算法推薦。
短影片分享平臺有最佳化演算法的迫切動力——推薦內容越豐富,越多元,使用者長期留存率越大。“資訊繭房”很多時候是要求演算法足夠精準,只推薦使用者明確感興趣的內容,這樣能夠在短期內獲得高流量,但長期來看,使用者也會因為內容單調而流失。
抖音需要平衡演算法的精準度和多樣性。一方面,在一個日均更新為億數量級的超級影片平臺上,如果完全採用使用者探索模式,獲取資訊的效率會非常低,需要演算法主動做出推薦。另一方面,也需要基於使用者的基本興趣做多樣性處理。
為了更好地推薦內容,抖音還加大了對小眾內容的扶持,對內容做“打散”,如果使用者連續刷到類似的內容,演算法會介入,控制相似內容出現的頻次。
不管推薦演算法如何複雜,其工作的核心都是學習使用者產生的行為反饋資料,並透過機率計算,將模型中推薦價值最高的影片推送給使用者。但如果單純依靠演算法預判行為而不加約束,可能會帶來不當內容氾濫等新問題。因此,還需要人工為其構築多層“護欄”,避免演算法對內容價值的“認知盲區”引發的問題。
抖音平臺透過五項舉措來為演算法設定“護欄”。第一,組建專門團隊,負責對治理標準進行准入及準出的管理工作。第二,該團隊設定了多項條款,並根據不同型別的內容制定對應標準。第三,不斷迭代和評估相關標準。第四,持續對標準落地質量追蹤和糾偏。第五,對使用者和作者開展治理標準普及工作。
去年,抖音建立了熱點當事人核實機制和事件核實機制。平臺會對熱度較高,但有可能是擺拍演繹內容,和作者建立聯絡,溝通並確認真實情況到底是什麼樣的。
演算法需要公開
演算法是工具,需要根據應用場景不斷最佳化調整,演算法公開是最佳化演算法的第一步。
從2024年開始,抖音演算法團隊就不斷討論演算法公開的可行性和具體方式,且已經將平臺治理和演算法透明度列為重點工作。
抖音生態運營經理陳丹丹在近期的一次交流中提到,隨著抖音平臺越來越大,大家在業務實踐過程中發現了很多問題,一方面,抖音需要彌補自己的短板;另一方面,也需要和外界做更多、更深入的溝通。透過提高透明度來營造一個可被信任的平臺環境。
資訊爆炸時代,在海量資訊中尋找自己所需的內容很多時候無異於大海撈針。據國際資料公司IDC釋出的《資料時代2025》報告顯示,全球每年產生的資料將從2018年的33 ZB(1 ZB等於10萬億億個位元組)增長到175 ZB,以25Mb/秒的下載速度計算,一個人下載全人類2025年產生的資料需要18億年。具體到個人,面對的新增資訊量,也從報紙時代的每天幾十個版面、數百條新聞,增加到一個平臺每天就有上億條新內容,遠超個人所能處理的極限。
人們需要演算法來做內容推薦,但如果演算法是個“黑箱”,不可避免會帶來包括繭房、資訊誘導等擔憂。演算法公開可以幫助打破資訊繭房,利於使用者高效率獲取資訊;也能讓公眾更好理解演算法,並參與到演算法治理中,提出實際有效的建議。
推薦演算法本質上是一套資訊分發系統,讓資訊匹配更高效。當代社會,資訊流動效率越高的經濟體,越具有競爭力和創新活力。推薦演算法帶來許多行業的新機遇,比如直播帶貨的主播,已經成為國家認證的新職業。這份工作背後已經有一套成熟的運作機制,而不是簡單粗暴的靠演算法發“彩票”。公開演算法,讓更多瞭解演算法的運作機制,能夠讓內容、社交生態都進入一個更良性的迴圈。
在提升資訊獲取效率之外,演算法在很多時候也能帶來社會價值。過去兩年,有不少相對小眾的旅遊城市被大眾熟知,包括山東淄博、甘肅天水等,很多本地人都沒能看見的資訊,被演算法看到了。
2023年9月,一條“探訪三花劇團開放式化妝間”的短影片在抖音上火了,成都三花劇團當時經營困難,一度瀕臨倒閉,但這條影片讓三花劇團在之後的三個月裡,賣出了2.5萬張票,比過去兩年賣的票還多,也直接讓這家劇團“起死回生”。
2023年2月,甲骨文專業研究生李右溪釋出了一條“挑戰全網最冷門專業”的影片,當晚播放量過百萬,而這也讓她調整了職業發展方向,變成了一個知識博主,在抖音上科普甲骨文知識,目前粉絲數量超過90多萬人,讓這個曾經極度冷門的專業變得受歡迎。
類似這樣小眾內容被看見的案例還有很多,比如鄉村老師張建濤在抖音上學習物理實驗,教孩子們成功發射了“水火箭”,他的影片又被更多人看到,一度帶動了鄉村學校研究“水火箭”實驗熱潮。重慶大學化學化工學院教授勾茜在抖音上科普星際化學知識,她希望透過這種方式把深奧的理科概念講得通俗易懂,這樣才會有更多人對冷門專業感興趣,加入研究隊伍。
今天,在抖音上,我們能很容易找到水稻種植、菌菇培育的相關內容。中國中小農使用者分佈廣,種植養殖種類眾多,需要的技術門類繁雜,過去科研機構和農業企業推廣、科普的過程中普遍面臨成本高、人手不足的問題。短影片和直播的平臺再加上演算法的助力,能夠讓專業人士和農業同行們更好的交流。在抖音,目前有超過30萬個果樹嫁接的影片,播放量超過7.5億。
演算法是技術工具,而非“幕後黑手”。瞭解演算法,調整演算法,最佳化演算法,才能讓演算法持續向善。


相關文章