色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

長篇累牘的推薦語和言簡意賅的關鍵詞,你更愿意看哪個?

DPVg_AI_era ? 來源:lq ? 2018-12-07 08:54 ? 次閱讀

單純的推薦結果和推薦結果+理由的組合,哪個更讓你信服?長篇累牘的推薦語和言簡意賅的關鍵詞,你更愿意看哪個?這是人們每天都會面對的場景,也是可解釋推薦系統研究需要不斷優化的問題。

近幾年,人工智能的可解釋性問題受到了來自政府、工業界和學術界的廣泛關注。美國國防部先進研究項目局DARPA資助了可解釋性人工智能項目XAI(Explainable AI);中國國務院在《新一代人工智能規劃》中提出的“實現具備高可解釋性、強泛化能力的人工智能”目標,得到了各個公司的積極響應;ICML 2017年的最佳論文《Understanding Black-Box Predictions via Influence Functions》以及NIPS 2017的最佳論文《A Linear-Time Kernel Goodness-of-Fit Test》也和可解釋性有著緊密關聯。

當深入研究這個新興且快速發展的領域時,一些尚未清楚的問題也困擾著我們。解釋的具體目標是什么?當我們要將解釋呈現給普通用戶看時,我們的目標是否會有變化?怎么對可解釋性的問題進行較為嚴格的定義?提高機器學習方法(如推薦模型)的可解釋性,現有方法的流程是什么樣的?未來的發展方向是什么樣的?

這些問題既困擾著我們,也帶來了研究的樂趣。本文將以推薦系統的解釋性為引,和大家分享我們探索到的部分答案,希望能對可解釋性研究起到拋磚引玉的作用。

目標及定義

可解釋機器學習的目標問題可以從2017年引起廣泛關注的機器學習煉金術之爭談起。NIPS 2017年時間檢驗獎(Test-of-Time Award)獲得者Rahimi在發表獲獎感言的時候表示,現在的機器學習已經越來越像煉金術了。其實如果只是簡單應用煉金術的結果倒也無妨,可是將類似煉金術的機器學習結果用于社交媒體甚至大選是不夠嚴謹和周密的,這也讓他感到不安。他的發言引起了很大的關注和爭論。他的質疑中提出的兩個問題,我們將它們總結為透明度和信任度。

關于可解釋機器學習目標,最普遍的看法是提高機器學習方法的透明度。以深度學習方法為例,很多人對深度神經網絡進行調試時,都將其看作黑匣子。我們只能看懂黑匣子的輸入輸出,很難理解黑匣子中的工作原理。這就造成了機器學習模型結果難以預測(能否點石成金?)、難以調試等問題,最終影響對機器學習模型的深入理解及結果的進一步提高。另一個目標是提高人們對于機器學習算法的信任度。在醫療、金融、軍事、政治等關鍵領域,機器學習的結果影響甚大,而可解釋機器學習則可以幫助決策者決定是否信任機器學習的結果。

這些目標都和模型密切相關,我們將它們統稱為模型可解釋性。如果只考慮這類目標,就忽視了解釋中非常關鍵的一環:用戶(解釋對象)。

當我們著眼于用戶,就發現解釋不僅要幫助我們提高對模型的理解,它本身的可讀性也很關鍵。如果解釋過于復雜,理解起來耗時耗力、需要極強的機器學習知識,這就和增強理解的初衷就背道而馳了。解釋本身需要簡明扼要、具有洞察力和高可讀性,否則和直接打印神經網絡每個參數輸出沒有本質區別。

在一些領域,我們需要把結果呈現給普通用戶看。例如推薦一本書給用戶,如果能用通俗易懂的解釋讓用戶了解到為什么會推薦這本書給他,可以極大地提高推薦的有效性(幫助用戶快速做出是否看書的決策)甚至推薦的說服力(提高用戶閱讀這本書的可能性)。這對用戶和廣告商都有重要的應用意義,但是目前學術界對這方面的探討比較少。我們認為將用戶更多地納入可解釋機器學習的考慮范疇,將極大提高可解釋方法的應用和研究價值??勺x性、有效性、說服力這類目標,我們統稱為解釋質量。上述討論的可解釋機器學習兩大類目標可以總結如下圖所示。

可解釋機器學習的目標:模型可解釋性(模型導向)以及解釋質量(用戶導向)

這些目標相輔相成,又相互制約。研究表明,提高透明度有助于提升解釋的說服力;而透明度和可讀性卻需要協調平衡,一個面面俱到、幫助人們深入理解模型的解釋(透明度高)很可能可讀性較低,因為人們需要花長時間理解;有效性旨在幫助用戶做最適合他們的決策,這和說服用戶接受某種決策也有相互矛盾之處。不同目標如何協調平衡,主要取決于具體的應用場景。

基于上述理解,我們可以嘗試對可解釋推薦下個定義。一般來說,可解釋推薦是在給出推薦結果的同時,給出對結果的支持論據(即解釋)。如果需要更細地進行定義,就要考慮具體應用及目標。如果更側重模型可解釋性(模型導向),就要求論據能夠幫助用戶更好地理解模型行為;如果更注重解釋質量中的說服力,則要求論據能夠增加用戶接受推薦物品的概率;如果更注重解釋質量中的有效性,則要求論據能夠幫助用戶做出更好地決定。

下圖是一個偏重解釋有效性的例子。和偏重說服力的相比,它不僅會突出餐館值得一去的原因(擔擔面好吃),還會指出餐館的一個缺點(價格偏高),幫助用戶做出更好的決定。

可解釋推薦偏重解釋有效性的例子

可解釋推薦流程

下面,我們回歸到可解釋推薦的場景下,看看現在可解釋方法的主要流程是什么樣的。這些流程里面主要涉及到推薦中的幾個關鍵要素:用戶集合U、物品集合V、被解釋的推薦系統f(u,v)、推薦系統的推薦物品集合V',解釋模塊以及其輸出的解釋z。

最常見的一種流程是后處理(Post-hoc)。如下圖所示,后處理的方法是在推薦結果已經給出后再進行解釋,解釋內容不受推薦系統f(u,v)的影響,即使換了一個推薦系統,只要給定同一個用戶和物品,解釋都是一樣的。這種方法主要優化的是解釋質量(希望生成可讀性、有效性高甚至具有說服力的解釋),但是模型解釋性較差,同時也比較容易實現,適合面向不懂機器學習的普通用戶進行解釋。主要應用場景包括廣告電商平臺、新聞、音樂、電影推薦等等。

可解釋推薦后處理流程

后處理方法主要研究解釋文本生成,分為三種方法:(1)基于規則;(2)基于檢索;(3)基于生成式模型。

基于規則是指由解釋方法設計者事先給定一些簡單模板(例如“N個微博用戶都喜歡這個商品”),算法只負責對模板中涉及的內容根據規則進行填充。基于檢索的方法是由解釋方法設計者規定解釋集合,算法負責對解釋集合進行排序,挑選排在最靠前的解釋輸出給用戶。例如給用戶推薦書時,解釋集合規定為用戶曾經看過的書,此時解釋模板為“看過X的用戶都很喜歡這本書”,算法只需要從集合中根據用戶的興趣及書的相似度挑選一本放入解釋即可。

基于規則和基于檢索的方法在生成解釋文本時,都需要模板,難免讓用戶覺得千篇一律、缺乏驚喜。有沒有辦法從數據中進行學習,進一步提高解釋的多樣性和說服力呢?我們組在這方面做了一些研究,發現可以從數據中學習,綜合廣告商提供的文案和被展示廣告的點擊率,利用改進的序列生成技術自動寫出廣告文案,這種方法已經被應用在微軟的搜索廣告中。下表展示了我們的廣告生成結果,可以看到不僅有一些具有說服力的話(如“Apply today & find your perfect job!”),而且生成結果多種多樣。

生成式模型自動寫出的廣告解釋文案

可解釋推薦的第二種流程是嵌入式(Embedded)。嵌入式的方法把解釋模塊融入到推薦系統的構建中(如下圖所示)。解釋模塊往往對物品的特征進行選擇,將對推薦準確性影響最大的物品挑選出來作為解釋。這里面用作解釋的物品特征往往是一些詞組(“屏幕清晰”)、語句(“這本書自2018年開始在全世界銷量5億本,是歷史上銷量最高的一本書?!保┗蛘呤菆D片。嵌入式的方法和后處理的相比,具有很高的模型解釋性,但是難以確保解釋質量,例如,難以保證解釋之間的連貫性及一致性,因此比較適合研究人員及算法開發人員。

可解釋推薦嵌入式流程

嵌入式方法的大部分解釋模塊都是淺層的,比如RecSys 2013年的論文《Hidden factors and hidden topics: Understanding rating dimensions with review text》中用到的主題模型,SIGIR 2014年的論文《Explicit factor models for explainable recommendation based on phrase-level sentiment analysis》中用到的矩陣分解,以及WWW 2018年論文《Neural attentional rating regression with review-level explanations》中用到的單層注意力網絡。

能否構建一個深層的網絡,每一層的特征和它們之間的關聯都是可解釋的呢?沿著這個思路研究,我們利用Microsoft Concept Graph構建了深度可解釋網絡的初始結構,并且利用Attentive Multi-View Learning對這個深度可解釋網絡中每層的參數進行優化,使它不僅可以提高推薦準確性、有用性,還可以通過無監督的方式自動對用戶的層次興趣進行建模。例如,我們可以知道用戶是只對壽司(低層特征)感興趣,還是對日料(高層特征)整體都比較感興趣。這部分工作我們發表在AAAI 2019論文《Explainable Recommendation Through Attentive Multi-View Learning》中,模型框架如下圖所示。

深度可解釋推薦模型:每一層的特征、相鄰層特征的關系都可讀

后處理和嵌入式的流程一個側重解釋質量,一個側重模型解釋性。有沒有方法能夠更好地兼顧兩者呢?在這樣的思考下,我們提出了封裝式(Wrapper)流程。如下圖所示,封裝式的方法不需要改變現有的推薦系統,只是將解釋模塊和推薦系統放在相對平等的位置,解釋模塊通過與推薦系統交互生成模型相關的解釋。這樣既可以自由控制解釋質量,又可以保證模型解釋性,同時也不需要像嵌入式的方法一樣針對不同的推薦模型設計不同的解釋方法,是一種協調模型解釋性與模型質量的很好的方法。

可解釋推薦封裝式流程

封裝式可解釋方法是利用增強學習實現的。具體來說,就是利用下圖所示的增強學習框架來對任何推薦模型進行解釋,可以同時確保模型解釋性以及解釋質量。在這個框架中,被解釋的推薦模型是環境(Environment)中的一部分??蚣苤杏袃蓚€智能體 (Couple Agents),其中智能體1負責生成解釋,智能體2負責利用解釋預測被解釋推薦模型的輸出(用戶對物品的打分)。這兩個智能體把需要解釋的模型當作黑盒子,通過與環境進行交互得到的獎勵(Reward)決定優化方向。

這里,環境給予的獎勵由兩個方面決定。如果智能體可以利用解釋準確預測(模仿)被解釋推薦模型的結果,則被獎勵,這體現的是對推薦模型的解釋能力。如果智能體給出的解釋精煉、有連貫性、可讀性較高,也會被獎勵,這是為了提高解釋本身的質量。這樣的框架適用于任何推薦模型,同時解釋能力和解釋質量都較高。這部分工作發表在ICDM 2018的論文《A Reinforcement Learning Framework for Explainable Recommendation》 中。

這個框架是我們在可解釋推薦框架方面的一個初步嘗試,它目前還有不少需要改進的地方。例如利用目前增強學習方法生成解釋有收斂較慢的問題,另外預先設定的獎勵機制是否與實際應用中希望的獎勵有直接聯系也需要進一步研究。接下來,我們會延續這個方向進行探索。

可解釋推薦的增強學習框架

機遇與挑戰

作為推薦領域被探索得較少的一個方向,可解釋推薦的很多方面都值得研究與探索。目前,我們在考慮從下面三個方面進行研究。

利用知識圖譜增強算法解釋能力

知識圖譜作為可讀性高的外部知識載體,給提高算法解釋能力提供了極大的可能性。例如,我們可以利用知識圖譜打通不同媒介之間的關聯?,F有的可解釋推薦所生成的推薦解釋往往只局限于以物品為媒介、以用戶為媒介或者以特征為媒介中的某一種,對這三類媒介之間的關聯挖掘得還不夠。我們希望能夠利用知識圖譜,打通這三類媒介之間的關聯,根據具體情況靈活選擇其中最合適的媒介對用戶進行推薦與解釋。在可解釋人工智能越來越重要的時代,將知識圖譜這類Symbolic Knowledge和深度學習結合,會是極有前景的方向。

普適的可解釋推薦框架及評測標準

目前可解釋推薦系統大多是針對特定的推薦模型設計,可拓展性較弱,對于新興的推薦模型,例如含有深度神經網絡的復雜、混合模型的解釋能力還不夠。如果有一個模型無關的可解釋推薦框架,就可以避免針對每個推薦系統分別設計解釋方案,從而提高方法的可拓展性。

另外,可解釋推薦如何評測一直是困擾可解釋性研究員的一個難題,線上(online)測試和人工標注條件要求較為苛刻,線下(offline)的評測標準還不夠成熟,我們希望在這個方向進一步研究,降低可解釋性研究的門檻,建立可解釋性的基礎理論。

結合生成模型進行對話式推薦

目前的推薦解釋往往形式是預先設定、千篇一律的(如預先設定推薦解釋是以用戶為媒介的)。這樣盡管也能根據用戶心理舉出一些例證,但是在溝通方式上還過于呆板,離拉家常式的推薦還有很大距離。如果能用生成模型讓推薦系統“自創”一句通順甚至高情商的話,就可以在與用戶聊天的過程中進行靈活、多變地推薦解釋了。我們團隊已經與微軟小冰合作,在這方面進行了一些嘗試,為小冰生成音樂推薦解釋,接下來還希望在這方面進行進一步地研究。

除了可解釋推薦系統,個性化推薦未來還有哪些研究熱點?在《預見未來 | 個性化推薦系統,必須關注的五大研究熱點》一文中,微軟亞洲研究院社會計算組的研究員們從深度學習、知識圖譜、強化學習、用戶畫像、可解釋推薦等五個方面展望了推薦系統的未來發展。

作者介紹

王希廷,微軟亞洲研究院研究員。2011年于清華大學獲得工學學士學位。2017年于清華大學獲得工學博士學位。她的研究成果發表在數據挖掘和可視化的頂級會議和期刊上,包括KDD、TKDE、AAAI、IJCAI、VAST和TVCG等。她的一篇一作論文被TVCG選為2016年12月的spotlight article。她曾擔任TKDE、TVCG、InfoVis等頂級會議、期刊的審稿人。

謝幸,微軟亞洲研究院首席研究員,中國科技大學兼職博士生導師。他的團隊在數據挖掘、社會計算和普適計算等領域展開創新性的研究。他在國際會議和學術期刊上發表了200余篇學術論文,共被引用18000余次,多次在KDD、ICDM等頂級會議上獲最佳論文獎。他是ACM、IEEE高級會員和計算機學會杰出會員,曾擔任ACM UbiComp 2011、PCC 2012、IEEE UIC 2015、以及SMP 2017等大會程序委員會共同主席。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47206

    瀏覽量

    238272
  • 機器學習
    +關注

    關注

    66

    文章

    8408

    瀏覽量

    132569

原文標題:揭秘可解釋推薦系統:知其然,知其所以然

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    [討論]提高網站關鍵詞排名的28個SEO小技巧

    提高網站關鍵詞排名的28個SEO小技巧關鍵詞位置、密度、處理 URL中出現關鍵詞(英文) 網頁標題中出現關鍵詞(1-3個) 關鍵詞標簽中出現
    發表于 12-01 17:08

    在Altium designer元件庫中搜d-sub的接口。哪個關鍵詞才能在庫里搜到

    我想在Altium designer元件庫中搜,d-sub的接口。分別是DB15、DB25、DB37。我搜哪個關鍵詞才能在庫里搜到。
    發表于 08-04 11:22

    TF-IDF測量文章的關鍵詞相關性研究

    停用詞的移除、大小寫字母轉化和詞干提取。4)獲取查詢。獲取單詞權重,對于可疑文檔利用TF-IDF獲得關鍵詞,并排序得到相應的關鍵詞列表。排在前n個的關鍵詞組成一個查詢,以此類推,本試驗中n=5。5)檢索
    發表于 01-26 10:38

    亞馬遜代運營 amazon Search term 關鍵詞填寫的“神技”

    關鍵詞。這種思路其實才是最正確的,已經試驗過了,效果相當不錯!對于 search term,它的運行其實是這樣的:填寫的就相當于數據庫,當買家用某個關鍵詞搜索時,如果
    發表于 06-05 15:41

    HanLP關鍵詞提取算法分析詳解

    l 參考論文:《TextRank: Bringing Order into Texts》l TextRank算法提取關鍵詞的Java實現l TextRank算法自動摘要的Java實現這篇文章中作者
    發表于 11-05 10:41

    基于Cortex-M處理器的高精度關鍵詞識別實現

    我們可以對神經網絡架構進行優化,使之適配微控制器的內存和計算限制范圍,并且不會影響精度。我們將在本文中解釋和探討深度可分離卷積神經網絡在 Cortex-M 處理器上實現關鍵詞識別的潛力。關鍵詞識別
    發表于 07-23 06:59

    關鍵詞優化有哪些實用的方法

    我們在做關鍵詞優化排名的時候,有經驗的seo人員都會有自己的一套關于關鍵詞應該怎么去優化排名的方法,但是對于一些剛接觸seo的新手來說就會比較迷茫,不知道應該怎么去做好關鍵詞的排名,大部分新手都主要
    發表于 08-11 01:19

    百度關鍵詞排名掉完了怎么辦

    一夜之間關鍵詞排名掉完了,沒有被K,也沒有出現違規操作,這是怎么回事呢?
    發表于 01-27 11:01

    如何在Cortex-M處理器上實現高精度關鍵詞的識別

    如何在 Cortex-M 處理器上實現高精度關鍵詞識別
    發表于 02-05 07:14

    #2023,的 FPGA 年度關鍵詞是什么? #

    FPGA 年度關鍵詞,我的想法是“標準化”;今年的工作中遇到了不少同事的issues,本身都是小問題或者很細節的東西但是卻反復出現問題,目前想到的最好的辦法是做好設計規則的標準化才能避免,不知道大家有沒有更好的建議?
    發表于 12-06 20:31

    基于強度熵解決中文關鍵詞識別

    文本的關鍵詞識別是文本挖掘中的基本問題之一。在研究現有基于復雜網絡的關鍵詞識別方法的基礎上,從整個復雜網絡拓撲結構特征的信息缺失角度來考察各節點的重要程度。提出強度熵測度來量化評估各節點重要程度,用于解決中文關鍵詞識別問題。實驗
    發表于 11-24 09:54 ?7次下載
    基于強度熵解決中文<b class='flag-5'>關鍵詞</b>識別

    基于關鍵詞的最優路徑查詢算法

    為改進基于關鍵詞的最優路徑查詢算法,在大規模圖以及多查詢關鍵詞下復雜度過高與可擴展性不足的缺陷,依據查詢關鍵詞序列構建候選路徑的策略提出一種高效查詢算法。該算法在路徑構建過程中優先滿足查詢關鍵
    發表于 12-06 11:28 ?0次下載

    基于詞頻統計的關鍵詞提取方法

    在TF-IDF算法基礎上,提出新的基于詞頻統計的關鍵詞提取方法。利用段落標注技術,對處于不同位置的詞語給予不同的位置權重,對分詞結果中詞頻較高的同詞性詞語進行詞語相似度計算,合并相似度較高的詞語
    發表于 12-15 15:29 ?13次下載
    基于詞頻統計的<b class='flag-5'>關鍵詞</b>提取方法

    基于自動關鍵詞抽取方法

    自動關鍵詞抽取是從文本或文本集合中自動抽取主題性或重要性的或短語,是文本檢索、文本摘要等許多文本挖掘任務的基礎性和必要性的工作.探討了關鍵詞和自動關鍵詞抽取的內涵,從語言學、認知科學
    發表于 12-26 16:47 ?2次下載
    基于自動<b class='flag-5'>關鍵詞</b>抽取方法

    融合BERT向量與TextRank的關鍵詞抽取方法

    結合文檔本身的結構信息與外部詞語的語義信息,提出一種融合BERT向量與 Textrank的關鍵詞抽取方法。在基于網絡圖的 Textrank方法基礎上,引入語義差異性并利用BERT向量加權方式優化
    發表于 03-21 09:55 ?18次下載
    融合BERT<b class='flag-5'>詞</b>向量與TextRank的<b class='flag-5'>關鍵詞</b>抽取方法
    主站蜘蛛池模板: 亚洲人成网站在线观看90影院| 无人区免费一二三四乱码| 亚洲黄色在线播放| 99婷婷久久精品国产一区二区| 国内极度色诱视频网站| 欧美一区二区高清| 亚洲综合无码一区二区| 高H各种PLAY全肉NP| 蜜臀AV精品一区二区三区| 亚洲精品色播一区二区 | 偷拍国产精品在线播放| 607080老太太AW| 精品高潮呻吟99AV无码| 素人约啪第五季| 扒开双腿疯进出爽爽爽动态图| 久久嫩草影院网站| 亚洲AV无码一区二区色情蜜芽| 抽插妇女疯狂视频| 尿了么app| 2021国产精品久久久久精品免费网| 国外成人电台| 午夜伦理网| 国产成+人欧美+综合在线观看| 欧美乱妇15p图| 91原创在线| 老阿姨儿子一二三区| 德国美女密密麻麻浓毛| 青青在线视版在线播放| 亚洲欧美一区二区三区九九九| 国产精品VIDEOS麻豆TUBE | 亚洲免费在线观看视频| 国产精品免费一区二区三区视频| 日韩 国产 中文 无码| CHINSEFUCKGAY无套| 魔乳 堕乳漫画acg产卵| 亚洲三级在线视频| 好男人在线观看免费视频WWW| 色宅男看片午夜大片免费看| 超大BBWWW| 日本一卡二卡三卡四卡无卡免费播放 | 综合亚洲桃色第一影院|