基于分布式詞向量的主題分類
大小:0.69 MB 人氣: 2017-12-05 需要積分:1
標(biāo)簽:分布式(74289)分類(12865)
主題分類在內(nèi)容檢索和信息篩選中應(yīng)用廣泛,其核心問題可分為兩部分:文本表示和分類模型。近年來,基于分布式詞向量對文本進(jìn)行表示,使用卷積神經(jīng)網(wǎng)絡(luò)作為分類器的文本主題分類方法取得了較好的分類效果。本文研究了不同詞向量對卷積神經(jīng)網(wǎng)絡(luò)分類效果的影響,提出針對中文語料的topic2vec詞向量模型。本文利用該模型,對具有代表性的互聯(lián)網(wǎng)內(nèi)容生成社區(qū)“知乎”進(jìn)行了實驗與分析。實驗結(jié)果表明,利用topic2vec詞向量的卷積神經(jīng)網(wǎng)絡(luò),在長內(nèi)容文本和短標(biāo)題文本的分類問題中分別取得了98.06%,93.27%的準(zhǔn)確率,較己知詞向量模型均有顯著提高。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%