抖音推薦演算法原理公開!不只取決於完播率,還有推薦打分公式

近日,抖音透過“抖音安全與信任中心”網站首次公開了其推薦演算法的原理,揭示了推薦系統不僅僅是基於完播率,還涉及複雜的多目標平衡和推薦打分公式。
———— / BEGIN / ————
近日,“抖音安全與信任中心”網站上線。網站面向社會公開抖音演算法原理、社群規範、治理體系和使用者服務機制。
該網站首次公開抖音推薦演算法原理,演算法介紹部分包括內容有:從零開始瞭解推薦系統,使用者行為背後的演算法推薦邏輯,抖音演算法的多目標平衡,平臺治理為推薦演算法設定“護欄”。

以下是部分推薦演算法原理闡述

推薦演算法是對使用者各種行為機率的綜合預估
推薦只預估行為動作
當用戶開啟抖音時,抖音的推薦演算法會給候選影片打分,並把得分最高的影片推送給使用者。
使用者在觀看時可以對看到的影片做出各種互動,這些互動體現了使用者對這個影片的感興趣程度。比如使用者點贊比不點贊要好,看完比沒看完要好,沒有點不喜歡比點不喜歡好。在這裡,“看完了”就是一次反饋動作,“點贊”也是一次反饋動作。
使用者對觀看的影片的每一次反饋,都有正面或者負面的價值。抖音的推薦排序模型學習的也就是這種行為反饋,推薦系統的目標就是把反饋價值最高的影片推給使用者。
抖音推薦演算法的核心邏輯可以簡化為“推薦優先順序公式”:綜合預測使用者行為機率 × 行為價值權重 = 影片推薦優先順序。公式展開為:
機率模型預測:抖音推薦演算法都預估使用者哪些行為
推薦演算法會透過演算法模型預測使用者對候選影片的行為機率(動作率)。結合使用者行為和影片本身的價值權重,推算出影片推薦的價值分數,並將綜合得出的價值最高的影片推送給使用者。
在這個過程中,推薦演算法會對使用者的一系列行為預估,這些行為包括點贊、關注、收藏、分享、不喜歡、是否點選作者頭像、評論區停留時長、長期消費等等。

抖音演算法的多目標平衡

推薦演算法透過各種“目標”來預估使用者行為,為使用者推薦內容。但使用者的行為動作有很多,不同行為的重要程度會決定演算法推薦的優先順序。因此,為推薦演算法設定合理的目標格外重要。
推薦演算法在誕生之初只關注單一或者少量的目標,比如完播、點贊,但隨著平臺內容和各方需求日益多元化,單一目標已難以滿足實際需求,多目標推薦系統成為主流。
多目標推薦系統,核心在於同時建模和最佳化多種不同的目標函式、以構建更全面平衡的推薦策略。多目標反映了使用者、平臺或創作者的多樣化需求。
透過提升使用者體驗,讓使用者喜歡使用產品,是所有推薦系統的天然目標。推薦演算法在誕生之初,大多是服務這個目標,比如預測使用者觀看完內容(即完播率)、點讚的機率。
早期的抖音以15秒短影片為主,在這一階段中,完播率是推薦演算法的核心目標之一,這背後的邏輯是,完播率越高則意味著越多使用者喜歡這條影片。
隨著抖音的使用者愈發多樣化,內容風格也日益多元,例如平臺上有了越來越多的優質中長影片,完播率等少數目標已經無法滿足更多樣的需求。因此,透過多目標建模,成為技術上的自然選擇。
經過長期發展,抖音已經發展出非常複雜的多目標體系,有效優化了對內容的價值評估。
基於多目標建模,抖音對所有準備推薦給使用者的影片進行打分,其公式可以簡化為:
由此可以看出,一個影片是否被推出,取決於多種因素。每種因素背後都有著多個目標導向的考量。
———— / E N D / ————
本文來自微信公眾號:三言Pro,作者:三言財經

相關文章