微博上近日流傳一個段子,“2020年曾是各大科幻片中遙遠的未來,但是現在離這個遙遠的未來也只有6個月時間了”。只是借此感慨一下2019年轉瞬之間半年的時間已經過去了,目前深度學習火熱朝天,深度學習在推薦系統和CTR預估工業界的論文也是一篇接著一篇良莠不齊。
接下來主要總結一下2019年上半年工業界深度推薦系統與CTR預估上值得精讀的論文。個人整理難免遺漏,也歡迎各位同行朋友評論另外哪些想額外推薦精讀的論文。
1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google作者:Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi;論文:t.cn/EUus1wu;Keynote:t.cn/EJFyMBk;
位列首位的當屬Youtube推薦強化學習的兩篇論文。雖然強化學習目前在推薦系統和CTR預估領域工業界由于系統復雜、效果未有顯著提升等眾所周知的原因確實不夠成熟也尚未大規模應用起來。但是Youtube推薦的這兩篇論文從某種程度上讓強化學習的應用方向變得更明確了一些,而且作者在Industry Day上也宣稱線上實驗效果顯示這個是YouTube單個項目近兩年來最大的reward增長,也從某種程度上會激發各大公司的研究者們繼續跟進的興趣。
這是第一篇論文,提出了一種Top-K的Off-Policy修正方案將RL中Policy-Gradient類算法得以應用在動作空間數以百萬計的Youtube在線推薦系統中。
2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google作者:Eugene Ie, Vihan Jain, Jing Wang, ..., Jim McFadden, Tushar Chandra, Craig Boutilier;論文:t.cn/AiKFHvYU;
這是Youtube推薦應用強化學習的第二彈,主要貢獻是提出了一種名為SLATEQ的Q-Learning算法,優化推薦系統里面同時展示給用戶多個item情況的長期收益LTV(Long-term Value),將長期收益加入排序多目標中進行建模優化。重點在于與baseline使用的深度網絡和輸入特征都完全一樣。詳見:Youtube推薦已經上線RL了,強化學習在推薦廣告工業界大規模應用還遠嗎?
3. Deep Learning Recommendation Model for Personalization and Recommendation Systems作者:Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,..., Bill Jia, Liang Xiong, Misha Smelyanskiy;論文:t.cn/Ai0rIUd0;代碼:t.cn/AiNGzCsY;解讀:t.cn/AiOX38PL;
FaceBook推薦最新論文,通過建模與系統協同設計提出一種butterfly-shuffle的機制來提升模型并行化,離線訓練上在沒有任何超參調優下收斂速度與準確率優于DCN,并開源了代碼。
4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei作者:Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang;論文:t.cn/AipAFS3p;
華為 at WWW 2019,提出基于卷積神經網絡的CTR特征生成方法FGCNN,包含特征生成和深度分類器兩部分,可以和任意CTR預估模型進行組合。
5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba作者:Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du;論文:t.cn/Ai0jTY68;代碼:t.cn/Ai0jTY6u;
阿里 at KDD 2019,提出DSTN模型用于點擊率CTR預估,考慮更多空域與時域的輔助信息包括上下文展示過的ad以及歷史點擊/未點擊ad來更好地預測目標item的點擊率。從論文實驗數據看,效果大幅度超過DeepFM和GRU,并開源了代碼。
6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang;論文:t.cn/AipG8aXz;代碼:t.cn/EI8Pnso;
最新的深度CTR預估模型AutoInt,通過過Multi-head注意力機制將特征投射到多個子空間中,并在不同的子空間中捕獲不同的特征組合形式,效果超過xDeepFM等達到最好。
7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent作者:Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin論文:t.cn/AiOaAg1Q;解讀:t.cn/AiOaAg1E;
騰訊 at KDD2019,微信看一看團隊對傳統Look-alike進行了改造,提出實時Look-alike算法RALM,解決推薦系統多樣性問題,效果好于YoutubeDNN。
8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems作者:Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai;論文:t.cn/AiN5T8Ks;TDM論文:t.cn/RQ5MrSg;
還記得阿里 at KDD 2018的深度樹匹配召回模型TDM嗎?升級版JTM提出索引與模型同時優化的方案,大幅提升召回效果。
9. A User-Centered Concept Mining System for Query and Document Understanding at Tencent, KDD 2019, Tencent作者:Bang Liu, Weidong Guo, Di Niu, Chaoyue Wang, Shunnan Xu, Jinghong Lin, Kunfeng Lai, Yu Xu論文:t.cn/Ai09Dxkd;解讀:t.cn/Ai09DxkB;數據資源:t.cn/Ai09Dxkr;
騰訊 at KDD2019,構建了ConcepT概念挖掘標記系統,利用query搜索點擊日志從用戶視角提取不同的概念,以提高對短文本(query)和長文章(document)的理解,從而推動推薦,搜索等業務的提升。實驗證明,ConcepT在 QQ 瀏覽器信息流業務中性能優異,曝光效率相對提升6.01%。
10. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang;論文:t.cn/AiN9QZnV;代碼:t.cn/AiN9QZnV;
阿里 at IJCAI2019,考慮到不同用戶行為序列的session內行為同構與session之間行為異構的特性提出了基于sesssion的CTR預估模型DSIN。使用self-attention機制抽取session內用戶興趣,使用Bi-LSTM針對用戶跨session興趣進行建模。
11. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent作者:Fuxing Hong, Dongbo Huang, Ge Chen;論文:t.cn/Ai0WHak5;代碼:t.cn/Ai0WHakt;
騰訊 at AAAI2019,提出IFM通過特征以及特征組不同角度靈活學習特征間交互的重要性,并提出了通用的Interation-NN框架和DeepIFM來捕捉高階交互,效果優于DeepFM并開源了代碼。
12. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall作者:Chao Li, Zhiyuan Liu, Mengmeng Wu, ..., Qiwei Chen, Wei Li, Dik Lun Lee論文:t.cn/AiOao6I4;解讀:t.cn/AiOao6I4;
阿里天貓提出MIND模型通過Dynamic Routing的方法從用戶行為和用戶屬性信息中動態學習出多個表示用戶興趣的向量,更好的捕捉用戶的多樣興趣,來提升召回的豐富度和準確度,效果好于YoutubeDNN。
13. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019, Alibaba作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai;論文:t.cn/AiN4s4oe;
阿里 at KDD2019,通過系統設計解決用戶超長行為歷史下CTR建模與在線預測性能瓶頸,效果好于GRU4Rec和DIEN。
14. Neural News Recommendation with Long- and Short-term User Representations, ACL 2019, Microsoft作者:Mingxiao An,Fangzhao Wu,Chuhan Wu,Kun Zhang,Zheng Liu,Xing Xie;論文:t.cn/Ai029G81;
微軟 at ACL 2019,LSTUR用于在新聞推薦任務中同時學習用戶長期和短期的興趣表示。模型的整體結構可分為新聞編碼器、用戶長期興趣和短期興趣模型、以及候選新聞的個性化分數預測模型,效果好于GRU4Rec。
15. Hierarchical Gating Networks for Sequential Recommendation, KDD 2019作者:Chen Ma, Peng Kang, Xue Liu;論文:t.cn/AipuFYkG;代碼:t.cn/AipuFYkb;
KDD2019,HGN提出通過feature與instance gating的多層級結構結合BPR來更好的捕獲用戶的長短期興趣,效果好于GRU4Rec以及NextItRec。
16. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba, KDD 2019, Alibaba作者:Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou論文:t.cn/Ai9JgWoJ;解讀:t.cn/AiKBda4q
阿里巴巴搜索推薦事業部的新研究,首次使用強大的 Transformer 模型捕獲用戶行為序列的序列信號,供電子商務場景的推薦系統使用。原有DIN 提出使用注意力機制來捕獲候選項與用戶先前點擊商品之間的相似性,但未考慮用戶行為序列背后的序列性質。離線實驗和在線 A/B 測試表明,BST 與現有方法相比有明顯優勢。目前 BST 已經部署在淘寶推薦的 rank 階段,每天為數億消費者提供推薦服務[2]。
17. Operation-aware Neural Networks for User Response Prediction作者:Yi Yang, Baile Xu, Furao Shen, Jian Zhao;論文:t.cn/AiO2Dp5k;代碼:t.cn/Ev4H3Jm;
深度CTR預估新積木:PNN + FFM - FM = ONN模型,效果好于DeepFM和PNN。
18. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer, Alibaba作者:Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang;論文:t.cn/AiNqPitA;
Transformer引入推薦系統工業界,利用用戶歷史點擊序列預測下一個點擊item,效果超過GRU4Rec。
19. A Capsule Network for Recommendation and Explaining What You Like and Dislike, SIGIR2019, Alibaba作者:henliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu;論文:t.cn/AiOLWp6x;
阿里 at SIGIR2019,膠囊神經網絡應用于推薦提出CARP模型來從評論中更好地建模用戶對商品的喜好程度,效果好于最新的ANR等。
20. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba作者:Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du;論文:t.cn/Ai0jcGIZ;代碼:t.cn/Ai0jcGIw;
阿里 at IJCAI2019,提出DeepMCP模型通過匹配、關聯、預測三個子模塊更好地建模用戶-ad,ad之間以及特征-CTR關系,效果優于DeepFM并開源了代碼。
-
算法
+關注
關注
23文章
4615瀏覽量
92980 -
分類器
+關注
關注
0文章
152瀏覽量
13196 -
論文
+關注
關注
1文章
103瀏覽量
14967
原文標題:20篇最值得一讀的深度推薦系統與CTR預估論文
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論