色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

京東:基于多類目MoE模型的電商搜索引擎

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-01-06 09:54 ? 次閱讀

商品索引擎是電商平臺滿足用戶購物需求的一個重要系統,它根據用戶輸入的搜索詞,返回個性化的排序列表。商品一般會被歸為某一大類下某個小類目,例如電子產品,在電子產品這個大類目下面還有更細粒度的類目(冰箱或者電視)。這種體系用于構造查詢類別的層次結構。在不同的查詢類別中,價格和品牌知名度等特征的分布差異很大。在CTR(點擊率)/CVR(轉化率)預估問題中,特征重要性在不同類目間也是不一樣的。本文主要介紹專家混合模型(MoE)在京東搜索精排中的應用,以及結合實際場景對MoE模型進行的一系列改進。

Part1. 背景介紹

越來越多的人轉向電子商務來滿足他們的購物需求,這給搜索排名帶來了新的挑戰。電子商務搜索排名的一個關鍵輸入是產品類別標簽,店主通常被要求用特定的類別來標記他們的產品,以方便搜索索引。從這些產品類別中,可以構造查詢類別的概念,通常是通過聚合在查詢下正確檢索到的最頻繁出現的產品類別。目前大多數電子商務排名系統都沒有為每個查詢類別部署專用模型的工程資源,即使是主要的查詢類別也是如此。但是作為人工編目員,自然的策略是首先確定查詢最可能屬于的類別,然后檢索該類別中的項目。不同類別的特性對于產品排名的重要性可能不同。直觀地說,根據用戶購買反饋判斷,不同類別的單獨排名策略應該能夠提高整體產品搜索相關性。
??京東電商平臺有一套完整的以樹形結構組織的多層級類目結構。下圖是一個兩層級類目結構的示意圖,不同的Top-Categories 之間,用戶的購物行為會有比較明顯的差異,例如:當用戶搜索食品相關商品時,可能選擇銷量高的;而當搜索服飾相關商品時,可能會更關注風格、品牌等信息。相反同一個Top-Categories下的Sub-Categories之間,用戶的購物行為一般比較接近。

01a6ab4c-8d5c-11ed-bfe3-dac502259ad0.png

此外,對于一些小類目的商品,在訓練集樣本量上和大類目相比差距懸殊,在模型訓練過程中會被大類目商品的樣本所影響和主導。針對類目差異和小類目學習這兩個問題,本文提出了一種多類目MoE(Mixture of Experts)模型。

Part2. 多類目MoE模型

MoE模型

MoE 主要包括兩個核心部分:門網絡(gating network)和專家網絡(expert network)。門網絡的輸出作為對應的專家網絡的權重,用于對專家網絡的輸出進行加權求和。MoE 模型的輸出可以寫成下面的公式:

其中,N表示專家網絡的個數,G表示門網絡,Q表示專家網絡。

Top-K gating MoE模型

模型會根據門網絡的輸出,選擇最大的K個權重所對應的專家網絡進行激活,然后只對選中的K個專家網絡的輸出進行加權求和。計算公式如下:

在Top_k MoE模型中,如果一個專家網絡對應的權重值不在最高的K個集合里,那么經過softmax函數之后權重會變為0。從而在模型訓練中這些專家網絡不會被激活,能降低模型的計算復雜度。

多類目MoE的模型

針對上述提到的類目差異和小類目學習兩個問題,本文在Top_K MoE 的基礎上加入了兩種改進方法,提出了多類目MoE的模型結構,如下圖:

01b7c71a-8d5c-11ed-bfe3-dac502259ad0.png

(1)Hierarchical Soft Constraint(HSC)網絡

針對小類目樣本學習問題,本文的改進是增加一個與MoE門網絡結構相同的HSC門網絡(圖種藍色部分)。HSC門網絡的輸入是Top-Category,輸出與MoE的門網絡結構維度一致,代表了不同專家網絡對于Top-Category 的重要程度。同時將激活的專家網絡對應的權重和HSC門網絡對應的權重的L2距離作為模型訓練的一個損失項,加入到模型的訓練過程中。
??具體來說,圖2中的Top-Category和Sub-Category具有層次關系,Top-Category是父節點,Sub-Category是子節點。為了進一步強調不同門網絡的功能,我們分別將它們稱之為inference MoE gate(綠色部分)和constraint HSC gate(藍色部分)。

a. Inference MoE Gate

將Sub-Category的嵌入向量,輸入inference gate,其輸出代表專家的權重。定義inference gate函數如下:

其中,是一個 q×N的可訓練的權重矩陣,q表示embedding的維度,N表示expert的個數。
??為了節省計算,只在中保留前K個值,并將其余值設置為?∞。然后應用softmax函數從前K個中得到如下的概率分布:
,如果
,如果<

由于有K個大于0的值,為了節省計算,只激活這些對應的專家。模型的計算復雜度取決于單個專家的網絡和K的取值。

b. Inference MoE Gate

在模型中,constraint gate和inference gate具有相同的結構。用表示constraint gate,表示inference gate,constraint gate的輸入特征記為,是Top-Category的嵌入向量,定義inference gate和constraint gate之間的分層軟約束(HSC)如下:



??通過上述HSC網絡,可以讓相同Top-Category下的所有Sub-Category所激活的專家網絡盡量的接近。尤其對于樣本量少的小類目,可以利用到相同Top-category下的其他類目信息,能一定程度上解決小樣本學習難的問題。

(2)Adversarial Regularization

第二個改進是Adversarial Regularization。在Top_K門網絡結構中,對于每條樣本,專家網絡都會分為激活的專家網絡和沒有激活的專家網絡。Adversarial Regularization的目的是在訓練過程中讓不同專家網絡盡量區別開,避免專家網絡的預測結果相同。即鼓勵激活的專家網絡和沒有被激活的專家網絡給出的預測結果差異較大。Adversarial Regularization計算公式如下:
其中, 表示激活的專家網絡集合, 表示沒有被激活的專家網絡集合。
??增加了HSC網絡和Adversarial Regularization之后,模型的損失函數如下所示:

Part3. 實驗結論

作者在Amazon和In-house兩個數據集上分別評估了所提出模型的效果。表格中的Adv-MoE和HSC-MoE分別表示只有Adversarial Regularization和HSC loss的兩個模型,Adv&HSC-MoE表示作者提出的最終多類目模型。
??作者首先在In-house數據集上測試了模型的整體效果、類目差異的效果以及在小樣本類目上的提升效果。表3給出了各個模型在AUC和NDCG兩個指標上結果。與DNN模型相比,本文提出的Adv&HSC-MoE模型在AUC指標上實現了0.96%的增益(NDCG為0.99%),具有較好的泛化性能。

01c91bdc-8d5c-11ed-bfe3-dac502259ad0.png

同時,作者也在amazon數據集上做了實驗,下表顯示改進后的Adv-MoE、HSC-MoE和Adv& HSC-MoE結果與In-house一致,驗證了對抗正則化和分層軟約束技術的一般適用性。

01d89fee-8d5c-11ed-bfe3-dac502259ad0.png

MoE模型門網絡的輸出代表了各個專家網絡的權重,作者同樣測試了不同類目下門網絡的輸出結果,以評估模型對于類目差異的學習效果。本文將門網絡的輸出結果使用T-SNE降維展示出來,以便觀察不同類目的聚類效果。圖5中藍色表示日用百貨類目,綠色表示電器類目,紅色表示流行服飾類目。結果顯示,本文的方法聚類效果更好,這表明對于相似的類目,本文提出的模型更傾向于選擇相似的專家網絡,差異大的類目,更傾向于選擇不同的專家網絡。

01ee71d4-8d5c-11ed-bfe3-dac502259ad0.png

Part4. 總結

本文提出的對抗性正則化和層次軟約束技術是在產品搜索中開發類別感知排名模型的有效方法。它在行業規模的數據集上取得了顯著的改進,主要體現在以下幾個方面:(1)同一Top-Categories下的Sub-Categories可以共享相似的專家,從而克服了有限訓練數據下的參數稀疏性;(2)對抗性正則化鼓勵專家“獨立思考”,從不同角度處理每個問題。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 網絡
    +關注

    關注

    14

    文章

    7571

    瀏覽量

    88865
  • 模型
    +關注

    關注

    1

    文章

    3254

    瀏覽量

    48875
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24719

原文標題:京東:基于多類目MoE模型的電商搜索引擎

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領域的AI搜索引擎——Accio。這一創新產品面向全球商家開放,標志著阿里國際正式入局當前備受矚目的AI Search賽道。
    的頭像 發表于 11-15 16:53 ?709次閱讀

    Meta開發新搜索引擎,減少對谷歌和必應的依賴

    近日,Meta正在積極進軍人工智能領域,并試圖跟上OpenAI的發展步伐。為實現這一目標,Meta正在開發一款全新的搜索引擎,該搜索引擎具備網絡爬蟲功能,能夠為用戶提供有關時事的對話答案,而這些答案
    的頭像 發表于 10-29 11:49 ?390次閱讀

    月訪問量超2億,增速113%!360AI搜索成為全球增速最快的AI搜索引擎

    與傳統搜索引擎不同,作為AI原生搜索引擎的360AI搜索基于公開網絡、知識庫、大模型三大支柱。借助首創的 CoE 技術架構,360AI搜索
    的頭像 發表于 09-09 13:44 ?491次閱讀
    月訪問量超2億,增速113%!360AI<b class='flag-5'>搜索</b>成為全球增速最快的AI<b class='flag-5'>搜索引擎</b>

    OpenAI推出SearchGPT原型,正式向Google搜索引擎發起挑戰

    在人工智能領域的持續探索中,OpenAI 邁出了重大一步,發布了其最新的 SearchGPT 原型,直接瞄準了 Google 的核心業務——搜索引擎。這一舉動不僅標志著 OpenAI 在技術上的又一次飛躍,也預示著搜索引擎市場即將迎來一場前所未有的變革。
    的頭像 發表于 07-26 15:11 ?585次閱讀

    微軟計劃在搜索引擎Bing中引入AI摘要功能

    近期,科技界傳來新動向,微軟緊隨百度與谷歌的步伐,宣布計劃在其搜索引擎Bing中引入先進的AI摘要功能,旨在為用戶帶來更加智能、豐富的搜索體驗。
    的頭像 發表于 07-26 14:23 ?476次閱讀

    新火種AI|谷歌推出AI搜索引擎惹得出版擔憂!新聞流量的至暗時刻要來了嗎?

    產生了一些思考:AI技術突飛猛進,已經出現了足夠先進的AI引擎,在這種情況下,傳統行業,特別是傳統新聞行業是否會受到深遠的沖擊?它們的未來又將何去何從? 谷歌探索AI新領域,致力于將AI模型Gemini融進全球搜索引擎。 根據財
    的頭像 發表于 05-17 09:40 ?359次閱讀
    新火種AI|谷歌推出AI<b class='flag-5'>搜索引擎</b>惹得出版<b class='flag-5'>商</b>擔憂!新聞流量的至暗時刻要來了嗎?

    OpenAI注冊新域名,準備推出結合AI技術的搜索引擎挑戰谷歌

    OpenAI最近注冊了“search.chatgpt.com”域名,看起來是要推出一款新的搜索引擎
    的頭像 發表于 05-08 10:41 ?471次閱讀

    OpenAI或將推出ChatGPT搜索引擎

    據可靠消息透露,OpenAI正秘密研發一款以ChatGPT為基礎的大型產品,其核心功能將是一款新型搜索引擎,旨在為用戶提供更便捷的上網體驗。
    的頭像 發表于 05-08 10:19 ?514次閱讀

    新火種AI|挑戰谷歌,OpenAI要推出搜索引擎

    新的搜索引擎,幫助用書輕松上網。 OpenAI的這一動向引起了業界的廣泛關注。作為OpenAI開發的一款強大的AI大語言模型,ChatGPT已經在自然語言處理的領域取得了顯著的成果,并給了人們全新的獲取信息的體驗。因此,自誕生以來,ChatGPT一直都被不少人視為能夠給予
    的頭像 發表于 05-07 22:06 ?367次閱讀
    新火種AI|挑戰谷歌,OpenAI要推出<b class='flag-5'>搜索引擎</b>?

    OpenAI或將在5月9日發布ChatGPT版搜索引擎

    OpenAI可能即將與谷歌展開正面競爭,推出基于ChatGPT的搜索引擎。根據Reddit網友的最新爆料,OpenAI有望在5月9日公布其全新的搜索產品。據悉,與這一新產品相對應的搜索網頁search.chatgpt.com的域
    的頭像 發表于 05-07 09:28 ?633次閱讀

    潤和軟件與新財富聯合發布金融AI對話式搜索引擎“金融搜一搜”產品

    3月29日,新財富投顧嘉年華活動中,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)與深圳市新財富數字科技有限責任公司(以下簡稱“新財富”)聯合發布了金融AI對話式搜索引擎——“金融搜一搜”產品,助力金融投資場景智能化升級。
    的頭像 發表于 04-02 10:15 ?504次閱讀
    潤和軟件與新財富聯合發布金融AI對話式<b class='flag-5'>搜索引擎</b>“金融搜一搜”產品

    微軟向Windows 10/11推送更新,建議將Bing設為Chrome默認搜索引擎

    微軟通過提示窗口表示,只要將Bing設為Chrome瀏覽器的默認搜索引擎,即可免費享用ChatGPT-4,且每天可與Bing人工智能進行數百次的對話交流。
    的頭像 發表于 03-15 14:32 ?1364次閱讀

    Redis官方搜索引擎來了,性能炸裂!

    RediSearch 是一個 Redis 模塊,為 Redis 提供查詢、二級索引和全文搜索功能。
    的頭像 發表于 02-21 10:01 ?2392次閱讀
    Redis官方<b class='flag-5'>搜索引擎</b>來了,性能炸裂!

    生成式AI恐使搜索引擎衰退,預計2026年搜索量將下滑25%

    據市場分析機構Gartner報道,生成式AI對傳統搜索引擎構成重大威脅,預計至2026年搜索量將降低25%。為此,企業需調整營銷策略。
    的頭像 發表于 02-20 10:04 ?714次閱讀

    谷歌搜索引擎優化的各個方面和步驟

    谷歌搜索引擎是最受歡迎和廣泛使用的搜索引擎之一,為了使你的網站在谷歌上更好地排名并提高曝光度,你可以采取一些谷歌搜索引擎優化的步驟。 使用關鍵字研究工具,如Google AdWords關鍵字規劃工具
    的頭像 發表于 01-25 10:29 ?895次閱讀
    主站蜘蛛池模板: 日韩欧美一级| 极品虎白在线观看| 成人免费精品视频| 韩国电影久久| 日韩欧美一区二区三区在线| 国产 高清 无码 中文| 女人张开腿让男人添| 一品道门免费高清视频| 国产精品麻豆AV| 日韩精品久久久久久久电影| 国产精品涩涩涩视频网站 | 把腿张开JI巴CAO死你H教室| 久久久久久久久性潮| 亚洲精品视频免费观看| 国产麻豆剧看黄在线观看| 男人和女人一级黄色大片| 亚洲视频在线观看网站| 国产人妻XXXX精品HD电影| 在线免费国产| 凌晨三点免费WWW| 24小时日本高清免费看| 男女啪啪抽搐呻吟高潮动态图| 99久久综合精品免费| 男男校园园bl文全肉高h寝室| 国产h视频在线观看网站免费| 色综合久久久久久| 国产成人在线视频免费观看| 在线播放毛片| 首页_亚洲AV色老汉影院| 国产亚洲精品久久久久久国| 无码欧美毛片一区二区三在线视频| 国产精品A久久777777| 亚洲AV无码一区二区三区牛牛| 好紧小嫩嫩水的10p| WINDOWSCHANNEL老太| 日韩伦理电影秋霞影院| 久久久久久久久女黄9999| 国产精品久久久久久人妻香蕉 | 你的欲梦裸身在线播放| 久久99热只有频精品| 最新快播网站|