色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

針對(duì)電商場(chǎng)景調(diào)優(yōu)BERT的論文

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2020-09-25 16:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近跟幾個(gè)做電商N(yùn)LP的朋友們聊天,有不少收獲。我之前從來沒想過【搜索】在電商里的地位是如此重要,可能GMV的50%以上都是從搜索來的。巨大的經(jīng)濟(jì)價(jià)值也極大地推動(dòng)了技術(shù)的發(fā)展,他們的工作做得很細(xì)致,畢竟一個(gè)百分點(diǎn)的點(diǎn)擊率后購買率提升也許對(duì)應(yīng)的就是幾百億的成交額。

其實(shí)之前做的汽車領(lǐng)域NLP工作跟電商有很多相似的地方,場(chǎng)景先驗(yàn)都非常重要。直接使用開放域語料預(yù)訓(xùn)練的語言模型效果并不好。我們也嘗試過一些方法,例如用本領(lǐng)域語料訓(xùn)練語言模型,結(jié)合一些詞庫詞典等等。今天介紹最近看到的一篇針對(duì)電商場(chǎng)景調(diào)優(yōu)BERT的論文《E-BERT: Adapting BERT to E-commerce with Adaptive Hybrid Masking and Neighbor Product Reconstruction》[1],其中的一些方法應(yīng)該對(duì)細(xì)分領(lǐng)域NLP有一些啟發(fā)。

方法

論文的創(chuàng)新方法主要有兩個(gè):Adaptive Hybrid Masking(AHM,自適應(yīng)混合掩碼)和Neighbor Product Reconstruction(NPR,相似商品重構(gòu))。

E-BERT總覽

AHM

第一個(gè)方法AHM其實(shí)是對(duì)已有掩碼方式的改進(jìn)。原始版本的BERT采用的是隨機(jī)mask,這個(gè)大家應(yīng)該都比較清楚。這種mask方式針對(duì)的是token,而眾所周知token是由單詞通過wordpiece tokenizer分割而來。所以這種方式遮蓋住的可能是單詞的一個(gè)部分,學(xué)習(xí)這種類似看三個(gè)字母猜剩下四個(gè)字母的任務(wù)不是很符合大家的直覺。隨后就誕生了更加符合人類認(rèn)知的Whole Word Masking,這個(gè)方法就是說要遮就遮整個(gè)詞。這里用一個(gè)網(wǎng)上的例子幫大家理解

InputText:themanjumpedup,puthisbasketonphil##am##mon'shead OriginalMaskedInput:[MASK]man[MASK]up,puthis[MASK]onphil[MASK]##mon'shead WholeWordMaskedInput:theman[MASK]up,puthisbasketon[MASK][MASK][MASK]'shead

philammon是一個(gè)詞,他會(huì)被tokenizer分解成三個(gè)token,這時(shí)就體現(xiàn)了普通mask和WWM的區(qū)別。

怎么繼續(xù)改進(jìn)遮蓋方法呢,一個(gè)比較直觀的方向是繼續(xù)提高遮蓋的整體性。前面是從token走到了word,可以繼續(xù)往前走一步到phrase。這個(gè)方向其實(shí)之前有人做了,比如SpanBert[2]隨機(jī)mask一小段,ERNIE[3]mask實(shí)體等等。這篇論文做了兩個(gè)工作,一個(gè)是進(jìn)一步提升遮蓋phrase的質(zhì)量,用了一種叫AutoPhrase[4]的方法來構(gòu)建高質(zhì)量的電商短語集合;第二個(gè)是設(shè)計(jì)了一套自適應(yīng)機(jī)制,讓模型訓(xùn)練在詞語遮蓋和短語遮蓋間切換,兩個(gè)方面合在一起就叫做AHM。

AHM總體的流程如下圖所示。對(duì)于一句輸入,首先用兩種方式進(jìn)行mask,左邊是常規(guī)word mask,右邊是phrase mask,然后輸入到BERT,分別得到MLM的loss,Lw和Lp。然后用一個(gè)函數(shù)f,根據(jù)兩個(gè)loss計(jì)算變量,跟預(yù)設(shè)的超參數(shù)進(jìn)行比較,如果就用word masking,反之就用phrase masking。的計(jì)算其實(shí)可以有很多方法,論文也沒有在這塊做對(duì)比實(shí)驗(yàn),我也就不展開,大家有興趣可以去看原文。

AHM總體流程

NPR

NPR是個(gè)比較有意思的部分,直觀的解釋是希望能通過一個(gè)商品重建出另一個(gè)相似商品的隱空間表示。具體的做法是把兩個(gè)商品a和b的文本內(nèi)容送進(jìn)Bert,得到各自的embedding矩陣;然后對(duì)這兩個(gè)句子做交叉注意力,得到注意力矩陣,然后用注意力矩陣加權(quán)a的embedding得到重構(gòu)后的b的embedding,反過來也從b重構(gòu)a。得到重構(gòu)后的embedding后再和原embedding計(jì)算距離作為loss,論文采用的是歐氏距離。只做相似商品重構(gòu)還不夠,論文還引入了不相似商品(隨機(jī)采樣)作為負(fù)樣本,采用triplet loss來計(jì)算最終的重構(gòu)損失。

NPR示意圖

效果

論文的實(shí)驗(yàn)和結(jié)果比較部分做的比較全面。

先介紹一下對(duì)照實(shí)驗(yàn)涉及的模型。baseline是裸BERT(BERT Raw),用電商數(shù)據(jù)finetune過的Bert外加SpanBERT作為對(duì)照組,finetune有兩種方法,分別是word masking的Bert和phrase masking的Bert-NP。實(shí)驗(yàn)組是各種配置的E-Bert,包括只使用phrase masking的E-Bert-DP,使用AHM的E-Bert-AHM和AHM+NPR的E-Bert。

評(píng)估效果使用了4個(gè)電商場(chǎng)景場(chǎng)景的下游任務(wù),Review-based Question Answering(基于評(píng)論的問答),Review Aspect Extraction(評(píng)論方面抽???),Review Aspect Sentiment Classification(評(píng)論情感分類)和Product Classification(商品類別分類)。

不同模型在不同任務(wù)上的結(jié)果如下圖

模型結(jié)果比較

從結(jié)果可以看出E-BERT在各種任務(wù)上都大幅領(lǐng)先裸BERT,甚至也大幅領(lǐng)先基于領(lǐng)域語料預(yù)訓(xùn)練過的BERT。文章的方法其實(shí)可以在任何的垂直領(lǐng)域中使用,可以說相當(dāng)?shù)膶?shí)用。

最近一個(gè)討論比較多的問題是在BERT時(shí)代,NLP算法工程師的價(jià)值是什么?我想這個(gè)結(jié)果可以從一個(gè)側(cè)面給答案,知道如何在模型中引入行業(yè)先驗(yàn)知識(shí)是可以大大提高模型在特定場(chǎng)景的表現(xiàn)的,即使如BERT這樣自身很強(qiáng)的超級(jí)模型也不例外。

參考資料

[1]

E-BERT: Adapting BERT to E-commerce with Adaptive Hybrid Masking and Neighbor Product Reconstruction: https://arxiv.org/pdf/2009.02835

[2]

SpanBERT: Improving Pre-training by Representing and Predicting Spans: http://arxiv.org/abs/1907.10529

[3]

ERNIE: Enhanced Language Representation with Informative Entities: http://arxiv.org/abs/1905.07129

[4]

AutoPhrase: https://github.com/shangjingbo1226/AutoPhrase

責(zé)任編輯:xj

原文標(biāo)題:E-BERT: 電商領(lǐng)域語言模型優(yōu)化實(shí)踐

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10773
  • AHM
    AHM
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    7547
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22598

原文標(biāo)題:E-BERT: 電商領(lǐng)域語言模型優(yōu)化實(shí)踐

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    手把手教你如何調(diào)優(yōu)Linux網(wǎng)絡(luò)參數(shù)

    在高并發(fā)網(wǎng)絡(luò)服務(wù)場(chǎng)景中,Linux內(nèi)核的默認(rèn)網(wǎng)絡(luò)參數(shù)往往無法滿足需求,導(dǎo)致性能瓶頸、連接超時(shí)甚至服務(wù)崩潰。本文基于真實(shí)案例分析,從參數(shù)解讀、問題診斷到優(yōu)化實(shí)踐,手把手教你如何調(diào)優(yōu)Linux網(wǎng)絡(luò)參數(shù),支撐百萬級(jí)并發(fā)連接。
    的頭像 發(fā)表于 05-29 09:21 ?189次閱讀

    xgboost超參數(shù)調(diào)優(yōu)技巧 xgboost在圖像分類中的應(yīng)用

    一、XGBoost超參數(shù)調(diào)優(yōu)技巧 XGBoost(eXtreme Gradient Boosting)是一種基于梯度提升決策樹(GBDT)的高效梯度提升框架,在機(jī)器學(xué)習(xí)競賽和實(shí)際業(yè)務(wù)應(yīng)用中取得了卓越
    的頭像 發(fā)表于 01-31 15:16 ?1210次閱讀

    用VESC調(diào)代替STLink給VESC調(diào)刷固件 可刷所有的基于VESC的調(diào)固件

    一、設(shè)備準(zhǔn)備1.1、VESC調(diào)準(zhǔn)備一個(gè)能夠正常運(yùn)行的VESC,另外準(zhǔn)備一個(gè)需要用用SWD的方式刷固件的調(diào)(可以是更換了新的MCU芯片的調(diào)
    發(fā)表于 12-01 21:31

    MCF8316A調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《MCF8316A調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 11-20 17:21 ?2次下載
    MCF8316A<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    MCT8316A調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《MCT8316A調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 11-13 13:49 ?0次下載
    MCT8316A<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    MCT8315A調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《MCT8315A調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 11-12 14:14 ?1次下載
    MCT8315A<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    MMC DLL調(diào)優(yōu)

    電子發(fā)燒友網(wǎng)站提供《MMC DLL調(diào)優(yōu).pdf》資料免費(fèi)下載
    發(fā)表于 10-11 11:48 ?0次下載
    MMC DLL<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>

    TDA3xx ISS調(diào)優(yōu)和調(diào)試基礎(chǔ)設(shè)施

    電子發(fā)燒友網(wǎng)站提供《TDA3xx ISS調(diào)優(yōu)和調(diào)試基礎(chǔ)設(shè)施.pdf》資料免費(fèi)下載
    發(fā)表于 10-11 10:16 ?0次下載
    TDA3xx ISS<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>和調(diào)試基礎(chǔ)設(shè)施

    大數(shù)據(jù)從業(yè)者必知必會(huì)的Hive SQL調(diào)優(yōu)技巧

    不盡人意。本文針對(duì)Hive SQL的性能優(yōu)化進(jìn)行深入研究,提出了一系列可行的調(diào)優(yōu)方案,并給出了相應(yīng)的優(yōu)化案例和優(yōu)化前后的SQL代碼。通過合理的優(yōu)化策略和技巧,能夠顯著提升Hive SQL的執(zhí)行效率和響應(yīng)速度。 關(guān)鍵詞: Hive
    的頭像 發(fā)表于 09-24 13:30 ?687次閱讀

    智能調(diào)優(yōu),使步進(jìn)電機(jī)安靜而高效地運(yùn)行

    電子發(fā)燒友網(wǎng)站提供《智能調(diào)優(yōu),使步進(jìn)電機(jī)安靜而高效地運(yùn)行.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 11:08 ?1次下載
    智能<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>,使步進(jìn)電機(jī)安靜而高效地運(yùn)行

    MMC SW調(diào)優(yōu)算法

    電子發(fā)燒友網(wǎng)站提供《MMC SW調(diào)優(yōu)算法.pdf》資料免費(fèi)下載
    發(fā)表于 09-20 11:14 ?0次下載
    MMC SW<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>算法

    如何調(diào)優(yōu)DS160PR410實(shí)現(xiàn)出色的信號(hào)完整性

    電子發(fā)燒友網(wǎng)站提供《如何調(diào)優(yōu)DS160PR410實(shí)現(xiàn)出色的信號(hào)完整性.pdf》資料免費(fèi)下載
    發(fā)表于 09-20 09:39 ?6次下載
    如何<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>DS160PR410實(shí)現(xiàn)出色的信號(hào)完整性

    TAS58xx系列通用調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《TAS58xx系列通用調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-14 10:49 ?1次下載
    TAS58xx系列通用<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    AM6xA ISP調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《AM6xA ISP調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-07 09:52 ?0次下載
    AM6xA ISP<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    OSPI控制器PHY調(diào)優(yōu)算法

    電子發(fā)燒友網(wǎng)站提供《OSPI控制器PHY調(diào)優(yōu)算法.pdf》資料免費(fèi)下載
    發(fā)表于 08-30 11:12 ?0次下載
    OSPI控制器PHY<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>算法
    主站蜘蛛池模板: 国产人妻麻豆蜜桃色在线 | 动漫美女脱小内内露尿口 | 精品国产免费人成视频 | 欧美最猛性XXX孕妇 欧美最猛性xxxxx亚洲精品 | 幼儿交1300部一区二区 | 又爽又黄又粗又大免费视频 | 日本免费一区二区三区最新vr | bl 纯肉 高Hbl被强文 | 国产真实女人一级毛片 | 国产精品一区二区资源 | x69老师x日本 | 国产专区亚洲欧美另类在线 | 国产亚洲精品久久久无码狼牙套 | 久久电影精品久久99久久 | 亚洲欧美中文在线一区 | 手机移动oa| 樱桃视频影院在线播放 | 真实国产熟睡乱子伦对白无套 | 亚洲欧美国产综合在线 | 把腿张开JI巴CAO死你H教室 | 国产毛片AV久久久久精品 | 日本老妇一级特黄aa大片 | 伊人影院香蕉久在线26 | 高清国语自产拍免费 | 日本高清不卡一区久久精品 | 日日干夜夜艹 | 国产传媒18精品A片在线观看 | 1000部做羞羞事禁片免费视频网站 | 亚洲 欧美 日韩 精品 自拍 | 久久re这里精品23 | 最近中文字幕MV免费看 | 日本高清免费观看 | 中文视频在线观看 | 欧美日韩中文字幕综合图区 | 久久操韩国自偷拍 | 视频一区亚洲视频无码 | 精品久久电影网 | 黄色免费网址在线观看 | 老头狠狠挺进小莹体内视频 | 久久九九有精品国产23百花影院 | 日本高清在线一区二区三区 |

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品