基于話題標簽和轉發的微博聚類和主題詞提取
大小:0.79 MB 人氣: 2017-12-23 需要積分:1
標簽:聚類(14184)
針對微博聚類正確率不高的問題,在研究微博數據特點的基礎上,利用微博hashtag來增強向量空間模型,使用微博之間的轉發關系提升聚類的準確性,并利用微博的轉發、評論數以及微博發布者信息來提取聚類中的主題詞。在新浪微博數據集上進行實驗發現,與k-means算法和基于加權語義和貝葉斯的中文短文本增量聚類算法(ICST-WSNB)相比,基于話題標簽和轉發關系的微博聚類算法的準確率比k-means算法提高了18.5%,比ICST-WSNB提高了6.48%,召回率以及F-值也有了一定的提高。實驗結果表明基于話題標簽和轉發關系的微博聚類算法能夠有效地提高微博聚類的正確率,進而獲取更加合適的主題詞。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于話題標簽和轉發的微博聚類和主題詞提取下載
相關電子資料下載
- 對新輔助TCHP治療響應的HER2+乳腺癌空間蛋白質組特征 547
- 使用輪廓分數提升時間序列聚類的表現 316
- 基于K-means聚類算法的圖像分割 1113
- 介紹一種基于最小化平方誤差的聚類算法 498
- 介紹一種基于分層聚類方法的木馬通信行為檢測模型 1060
- 深度學習聚類的綜述 780
- 聚類分析中的機器學習與統計方法綜述(二) 679
- 如何在 Python 中安裝和使用頂級聚類算法 415
- 聚類分析中的機器學習與統計方法綜述(一) 638
- 機器學習之分類分析與聚類分析 3550