資料介紹
眾多自然語言處理( Natural Language Processing,NLP)任務(wù)受益于在大規(guī)模語料上訓(xùn)練的詞向量。由于預(yù)訓(xùn)練的詞向量具有大語料上的通用語義特征,因此將這些詞向量應(yīng)用到特定的下游任務(wù)時,往往需要通過微調(diào)進(jìn)行一定的更新和調(diào)整,使其更適用于目標(biāo)任務(wù)。但是,目標(biāo)語料集中的低頻詞由于缺少訓(xùn)練樣夲,導(dǎo)致在微調(diào)過程中無法獲得穩(wěn)定的梯度信息,使得詞向量無法得到有效更新。而在短文本分類任務(wù)中,這些低頻詞對分類結(jié)果同樣有著重要的指示性。因此,在具體的短文本分類任務(wù)上獲得一個更妤的低頻詞詞向量表示是有必要的。針對這個問題,文中提出了一種與下游任務(wù)模型無關(guān)的低頻詞詞向量更新算法,通過基于K近鄰的詞向量偏移計算方法,利用通用詞向量中與低頻詞相似的高頻詞所獲得的任務(wù)特征信息,來指導(dǎo)低頻詞的信息更新,從而獲得更準(zhǔn)確的且適用于當(dāng)前任務(wù)語境的低頻詞詞向量表示;并以 Textcnn作為基準(zhǔn)模型,基于word2vec和 Glove得到的兩個通用預(yù)訓(xùn)練詞向量,在3個公開的短文本數(shù)據(jù)集上進(jìn)行了優(yōu)化算法的效果驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,使用優(yōu)化算法更新低頻詞詞表示后,模型分類準(zhǔn)確率能達(dá)到84.3%~94%,較更新前提升了0.4%%,體現(xiàn)了優(yōu)化算法的有效性,也進(jìn)一步證明了短文本分類任務(wù)中低頻詞對分類結(jié)果的影響,為短文本分類的研究工作提供了一定的借鑒。
- 基于LSTM的表示學(xué)習(xí)-文本分類模型 18次下載
- 面向短文本的中文真詞錯誤檢測與修復(fù) 6次下載
- 面向短文本的中文真詞錯誤檢測與修復(fù) 2次下載
- 基于主題分布優(yōu)化的模糊文本分類方法 5次下載
- 基于雙通道詞向量的卷積膠囊網(wǎng)絡(luò)文本分類算法 6次下載
- 基于不同神經(jīng)網(wǎng)絡(luò)的文本分類方法研究對比 48次下載
- 基于主題相似度聚類的文本分類算法綜述 6次下載
- 基于單詞貢獻(xiàn)度和Word2Vec詞向量的文檔表示方法 2次下載
- 基于BERT+Bo-LSTM+Attention的病歷短文分類模型 13次下載
- 融合BERT詞向量與TextRank的關(guān)鍵詞抽取方法 18次下載
- 集成WL-CNN和SL-Bi-LSTM的旅游問句文本分類算法 5次下載
- 一種基于神經(jīng)網(wǎng)絡(luò)的短文本分類模型 8次下載
- 結(jié)合BERT模型的中文文本分類算法 6次下載
- 基于微博文本的詞對主題演化模型 14次下載
- 融合詞語類別特征和語義的短文本分類方法 0次下載
- 卷積神經(jīng)網(wǎng)絡(luò)在文本分類領(lǐng)域的應(yīng)用 358次閱讀
- 人工智能中文本分類的基本原理和關(guān)鍵技術(shù) 951次閱讀
- ElasticSearch同義詞代碼解析 674次閱讀
- 機(jī)器學(xué)習(xí)相關(guān)介紹:支持向量機(jī)(低維到高維的映射) 1892次閱讀
- 如何才能自己做詞云圖 8002次閱讀
- 文本分類中處理樣本不均衡和提升模型魯棒性的trick 905次閱讀
- 帶你從頭構(gòu)建文本分類器 3288次閱讀
- 訓(xùn)練一個機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)了根據(jù)基于文本分析預(yù)測葡萄酒質(zhì)量 5965次閱讀
- 如何表示一個詞語的意思?神經(jīng)網(wǎng)絡(luò)詞嵌入的基本思路 3735次閱讀
- 詞對嵌入技術(shù),可以改善現(xiàn)有模型在跨句推理上的表現(xiàn) 2998次閱讀
- Python數(shù)據(jù)挖掘:WordCloud詞云配置過程及詞頻分析 3848次閱讀
- 如何為文本分類任務(wù)選擇正確的模型,這里有一個完整流程圖! 1.2w次閱讀
- 文本分類任務(wù)介紹和傳統(tǒng)機(jī)器學(xué)習(xí)方法 9606次閱讀
- 一種改變標(biāo)準(zhǔn)的谷歌關(guān)鍵詞搜索的新方式 6723次閱讀
- 自然語言處理技術(shù)入門之基于關(guān)鍵詞生成文本的技術(shù)實(shí)現(xiàn)過程 1w次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動電路設(shè)計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評論
查看更多