如何充分利用各種用戶反饋信息,來提升推薦系統的性能?來自騰訊微信團隊的謝若冰、凌程、王亞龍、王瑞、夏鋒和林樂宇研究員對此進行了研究,并提出新的 Deep Feedback Network (DFN) 模型,性能相比基線取得顯著提升。目前,該研究相關論文《Deep Feedback Network for Recommendation》已被 IJCAI-2020 會議接收。
在推薦系統中,用戶的顯式反饋、隱式反饋、正反饋和負反饋都能夠反映用戶對被推薦物品的偏好,這些反饋信息在推薦系統中十分有用。然而,現在的大規模深度推薦模型往往以點擊為目標,只看重以用戶點擊行為為代表的隱式正反饋,而忽略了其它有效的用戶反饋信息。騰訊微信的這項研究關注用戶多種顯式/隱式和正/負反饋信息,學習用戶的無偏興趣偏好。 具體而言,該研究團隊提出了 Deep Feedback Network (DFN) 模型,綜合使用用戶的隱式正反饋(點擊行為)、隱式負反饋(曝光但未點擊的行為)以及顯式負反饋(點擊不感興趣按鈕行為)等信息。DFN 模型使用 internal feedback interaction component,來抓住用戶行為序列中的細粒度行為級別交互,然后通過 external feedback interaction component,使用精確但稀少的隱式正反饋和顯式負反饋作為監督,從噪音較多的隱式負反饋中進一步抽取用戶的正負反饋信息。在實驗中,研究人員基于微信看一看的數據,進行了豐富的離線和在線實驗,模型性能與 baseline 相比取得顯著提升。 一、模型背景與簡介 推薦系統在日常生活中被廣泛使用,為用戶獲取信息與娛樂提供了極大的便利。推薦系統算法往往基于用戶與系統的交互,這些交互行為可以大致分為以下兩類:顯式反饋與隱式反饋。
顯式反饋從用戶對物品的直接態度中獲取,例如評論中的一星到五星,或者微信看一看系統中的「不感興趣」按鈕。這類反饋能夠直接表達用戶的正向以及負向偏好,但是此類反饋的數量往往不多。
隱式反饋從用戶的行為中間接獲得,例如用戶的點擊/不點擊行為。這些信息在推薦系統中往往是海量的,但是這些信息有著較多噪聲(用戶點擊的并不一定是他真正喜歡的)。另外,隱式反饋通常是以正反饋的形式出現,推薦中的隱式負反饋存在巨大噪聲(未展現信息或者未點擊信息未必表示用戶不喜歡這些內容)。
在近期的深度推薦系統中,CTR 導向的目標受到極大關注。因此,模型不可避免地只關注和目標緊密相關的用戶點擊行為,忽略了其它用戶行為中蘊含的豐富信息。 僅考慮 CTR 導向目標的推薦模型往往會遇到以下兩個問題: (1)CTR 導向目標只關注用戶喜歡什么,沒有關注用戶不喜歡什么。這樣,模型的推薦結果容易同質化和趨熱化,損害用戶體驗。因此,負反饋信息是必要的。 (2)用戶除了被動地接受系統推薦的物品,有時也需要主動和即時的反饋機制。用戶希望能夠高效和準確地告知系統自己喜歡或者不喜歡什么。另外,用戶的顯式和隱式反饋之間也存在割裂(用戶點擊的并不一定是他真正喜歡的)。因此,顯式反饋也是必要的。顯式信息和隱式信息能夠作為彼此的補充,相輔相成。 已有工作使用用戶的未點擊/未曝光行為作為隱式負反饋,這樣會引入極大的噪聲。另外一些工作嘗試使用用戶的顯式負反饋信息。這些信息固然精確,但是也往往比較稀疏。
圖 1:微信看一看系統中的三種反饋,從左到右分別為隱式正反饋(點擊行為)、隱式負反饋(曝光但未點擊的行為)以及顯式負反饋(點擊不感興趣按鈕行為)。 為了解決這些問題,綜合使用用戶多種顯式/隱式和正/負反饋信息學習更好的無偏用戶表示,該團隊提出了 Deep Feedback Network (DFN) 模型。 圖 1 給出了在微信看一看場景中的三種用戶反饋。DFN 通過 internal feedback interaction component 抓住用戶行為序列中的細粒度行為級別交互,然后通過 external feedback interaction component,使用精確但稀少的隱式正反饋和顯式負反饋作為監督,從噪音較多的隱式負反饋中進一步抽取用戶的正負反饋信息。這些反饋特征會和其他用戶/物品特征混合,并行使用 FM、Deep 和 Wide 層進行特征交互,最后進行 CTR 預估。該研究團隊基于微信看一看推薦系統,設計了離線和線上實驗,在多個指標上出現顯著提升。這篇工作的主要貢獻如下:
首次融合隱式正反饋(點擊行為)、隱式負反饋(曝光但未點擊的行為)、顯式負反饋(點擊不感興趣按鈕行為)和它們之間的交互信息進行用戶行為建模;
提出全新的 Deep Feedback Network (DFN) 模型,能夠學習到用戶的無偏興趣偏好;
模型在離線和在線任務上的性能都得到了顯著提升,具有工業級實用價值。論文也提出了一個 feed 流中的顯式負反饋預測任務。
二、模型結構 DFN 模型主要分為三個階段:
首先,deep feedback interaction module 以用戶的多種反饋行為作為輸入,輸出用戶的反饋特征。
然后,Feature Interaction Module 進一步考慮用戶的其它特征和物品特征,使用 FM、Deep 和 Wide 層進行特征交互。
最后,輸出層使用 CTR 作為訓練目標。
圖 2 給出了 DFN 的整體結構。
圖 2:DFN 的整體結構。 deep feedback interaction module 是該模型的主要創新點。它包括兩個組成部分:Internal Feedback Interaction Component 和 External Feedback Interaction Component。圖 3 給出了 deep feedback interaction module 的結構。
圖 3:deep feedback interaction module 首先,在 Internal Feedback Interaction Component 中,用戶的隱式正反饋、隱式負反饋和顯式負反饋序列和 target item 一起,通過一個 transformer 層,得到在各個序列內部細粒度的 item-level 交互信息。然后經過 average 層得到三種反饋的特征表示,其中隱式正反饋特征中蘊含高質量的用戶正向偏好,顯式負反饋特征中蘊含高質量的用戶負向偏好。 第二步,在 External Feedback Interaction Component 中,隱式負反饋序列往往是三種行為中最多的行為,但也是噪聲最大的行為。該研究把高質量的和 target item 交互后的隱式正反饋特征和顯式負反饋特征看作一種高質量指導,從用戶未點擊序列中挖掘用戶或許喜歡/不喜歡的物品,補充用戶的正向負向偏好。研究人員使用一個 attention 層,得到兩種用戶弱正向/負向反饋特征。這兩種弱反饋特征和第一步的三種反饋特征拼接后成為最終的用戶反饋特征。 第三步,在 Feature Interaction Module 中,研究人員使用 FM、Wide 和 Deep 層,對用戶其它特征、物品特征和用戶反饋特征等進行低階/高階特征交互。這個模塊是為了充分利用各種特征輔助推薦,使得模型在真實工業級任務上達到最好的效果。使用 Wide 層主要是為了給潛在的特征工程留下接口。 最后,研究人員基于 CTR loss 進行訓練。除去傳統的正例和未點擊負例,該研究還增加了一項預測用戶負反饋點擊的 loss。由于在實際推薦系統中,用戶給出主動顯式負反饋的次數極少,顯式負反饋中的負向信息也極其強烈,所以該研究單獨在 loss 中強調了這一項,并且給予了較大的訓練權重。
三、實驗結果 離線和線上實驗均在微信看一看上進行,離線數據集包含千萬級用戶在百萬級物品上的億級行為。模型離線 CTR 預估結果如圖 4:
圖 4:CTR 預估結果。 DFN 模型取得了 SOTA 結果。 研究者還通過圖 5 給出了一個新的不感興趣預估實驗。由于用戶點擊不感興趣按鈕說明用戶對于推薦結果很失望,這類推薦結果會極大損害用戶體驗,模型應該能夠對這類反饋及時捕捉并響應,理想狀態下應通過用戶實時行為避免用戶產生顯式負反饋的結果。
圖 5:dislike 預估結果。 該研究還進行了控制變量實驗。證明反饋模塊的每一個組成部分都是有效的。
圖 6:控制變量實驗結果。 最后,研究人員還給出了參數實驗,探索不感興趣 loss 的權重影響。
圖 7:參數實驗結果。 四、總結 在這篇論文中,作者初步研究了推薦系統中的多種顯式/隱式和正/負反饋之間的協同合作機制。DFN 模型能夠基于多種反饋信息即時學習用戶的無偏正負向興趣,在點擊預估和不感興趣預估等多個任務上均實現性能提升效果。直觀而有效的模型也使得 DFN 能成功在工業級推薦系統中得到部署和驗證。騰訊微信團隊預測,用戶的顯式反饋特別是顯式負反饋信息將會在未來推薦系統中起到更加重要的作用,在發掘推薦系統可解釋性的同時提升用戶體驗。
-
模型
+關注
關注
1文章
3253瀏覽量
48874 -
DFN
+關注
關注
0文章
11瀏覽量
8539 -
數據集
+關注
關注
4文章
1208瀏覽量
24717
原文標題:如何實現更好的推薦結果?騰訊微信提出深度反饋網絡
文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論