基于隱含狄列克雷分配LDA分類特征擴展的廣告過濾方法
大小:0.82 MB 人氣: 2017-12-14 需要積分:1
標(biāo)簽:LDA(10554)
傳統(tǒng)的微博廣告過濾方法忽略了微博廣告文本的數(shù)據(jù)稀疏性、語義信息和廣告背景領(lǐng)域特征等因素的影響。針對這些問題,提出一種基于隱含狄列克雷分配( LDA)分類特征擴展的廣告過濾方法。首先,將微博分為正常微博和廣告型微博,并分別構(gòu)建LDA主題模型預(yù)測短文本對應(yīng)的主題分布,將主題中的詞作為特征擴展的基礎(chǔ);其次,在特征擴展時結(jié)合文本類別信息提取背景領(lǐng)域特征,以降低其對文本分類的影響;最后,將擴展后的特征向量作為分類器的輸入,根據(jù)支持向量機(SVM)的分類結(jié)果過濾廣告。實驗結(jié)果表明,與現(xiàn)有的僅基于短文本分類的過濾方法相比,其準(zhǔn)確率平均提升4個百分點。因此,該方法能有效擴展文本特征,并降低背景領(lǐng)域特征的影響,更適用于數(shù)據(jù)量較大的微博廣告過濾。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于隱含狄列克雷分配LDA分類特征擴展的廣告過濾方法下載
相關(guān)電子資料下載
- QCC5181QCC3086QCC3084QCC3083 USB Audio 96K/24bit LDAC 738
- QCC5181藍(lán)牙音頻發(fā)射LDAC APTX 549
- 華為5G移動核心網(wǎng)在GlobalData連續(xù)六年摘得桂冠 305
- 華為5G移動核心網(wǎng)在GlobalData連續(xù)六年排名第一 363
- QCC5181QCC3083QCC3084支持LDAC APTX LOSSLESS 3431
- 帶分區(qū)的大規(guī)模LDAP介紹 312
- SLDA副會長單位旭宇光電獲“國家知識產(chǎn)權(quán)示范企業(yè)” 786
- java 8的日期用法 285
- Java時間類轉(zhuǎn)換方案 326
- 常見的幾種日期對象用法 450