資料介紹
隨著文本數(shù)據(jù)來源渠道越來越豐富,面向多源文本數(shù)據(jù)進行主題挖掘已成為文本挖掘領域的研究重點。由于傳統(tǒng)主題模型主要面向單源文本數(shù)據(jù)建模,直接應用于多源文本數(shù)據(jù)有較多的限制。針對該問題提出了基于狄利克雷多項分配( DMA)模型的多源文本主題挖掘模型——多源狄利克雷多項分配模型(MSDMA)。通過考慮主題在不同數(shù)據(jù)源的詞分布的差異性,結合DMA模型的非參聚類性質,模型主要解決了如下三個問題:1)能夠學習出同一個主題在不同數(shù)據(jù)源中特有的詞分布形式;2)通過數(shù)據(jù)源之間共享主題空間和詞項空間,使得數(shù)據(jù)源間可進行主題知識互補,提升對高噪聲、低信息量的數(shù)據(jù)源的主題發(fā)現(xiàn)效果;3)能自主學習出每個數(shù)據(jù)源內(nèi)的主題數(shù)量,不需要事先給定主題個數(shù)。最后通過在模擬數(shù)據(jù)集和真實數(shù)據(jù)集的實驗結果表明,所提模型比傳統(tǒng)主題模型能更有效地對多源數(shù)據(jù)進行主題信息挖掘。
在互聯(lián)網(wǎng)發(fā)展早期,網(wǎng)絡上可獲取文本數(shù)據(jù)的渠道(數(shù)據(jù)源)較少,文本挖掘任務主要面向單源文本數(shù)據(jù)。隨著互聯(lián)網(wǎng)的快速發(fā)展,特別是移動互聯(lián)網(wǎng)的普及率越來越高,幾乎每個人都能上網(wǎng)獲取資訊和發(fā)表觀點,因此出現(xiàn)了各種各樣的文本數(shù)據(jù)生產(chǎn)渠道,如各種社交媒體、新聞門戶、博客及論壇等。這些渠道時刻都在產(chǎn)生海量的文本數(shù)據(jù),同時對這些文本數(shù)據(jù)源進行主題信息提取通常具有比較重要的應用價值,如在網(wǎng)絡新聞采編和網(wǎng)絡輿情分析應用中,需要知道在每個渠道的主題分布,以及某個關注的主題在每個渠道的表現(xiàn)方式等。
- 抖動按鍵技術及雙狄拉克模型綜述 2次下載
- 基于終身機器學習的主題挖掘評分和評論推薦模型 42次下載
- 文本挖掘之概率主題模型綜述 16次下載
- 基于深度學習的文本主題模型研究綜述 68次下載
- 基于Spark的學術論文熱點數(shù)據(jù)挖掘方法 4次下載
- 基于神經(jīng)網(wǎng)絡與隱含狄利克雷分配的文本分類 1次下載
- 基于狄利克雷過程的可擴展高斯混合模型 7次下載
- 一種捕獲主題單詞信息的主題模型JEA-LDA 19次下載
- 基于狄利克雷問題的動態(tài)劃分算法 18次下載
- 基于層次交互式主題建模 0次下載
- 作者標簽主題LAT模型在科技文獻中應用 0次下載
- 適用于圖書推薦的數(shù)據(jù)挖掘模型 0次下載
- 基于LDA主題模型進行數(shù)據(jù)源選擇方法 0次下載
- 基于概率主題模型的景點主題模型 3次下載
- 基于微博文本的詞對主題演化模型 14次下載
- 利用OpenVINO部署Qwen2多模態(tài)模型 505次閱讀
- llm模型和chatGPT的區(qū)別 1211次閱讀
- 北大&華為提出:多模態(tài)基礎大模型的高效微調(diào) 1086次閱讀
- 初識IBIS模型 2110次閱讀
- 從進程模型轉換成線程模型的優(yōu)缺點 476次閱讀
- 基于預訓練模型和語言增強的零樣本視覺學習 585次閱讀
- 基于文本到圖像模型的可控文本到視頻生成 983次閱讀
- Meta開源文本如何生成音樂大模型 937次閱讀
- 大型語言模型能否捕捉到它們所處理和生成的文本中的語義信息 746次閱讀
- 摘要模型理解或捕獲輸入文本的要點 1034次閱讀
- 基于文本驅動的三維模型風格化方法 7222次閱讀
- 如何使用BERT模型進行抽取式摘要 4852次閱讀
- 訓練一個機器學習模型,實現(xiàn)了根據(jù)基于文本分析預測葡萄酒質量 6186次閱讀
- 如何使用TensorFlow Hub文本模塊構建一個模型,以根據(jù)相關描述預測電影類型 3220次閱讀
- 一文詳解隱含狄利克雷分布(LDA) 1w次閱讀
下載排行
本周
- 1VCC啟動電路(可下載)
- 748.32 KB | 2次下載 | 免費
- 2TDA7850音頻功率放大器英文手冊
- 0.39 MB | 1次下載 | 免費
- 3HAC1108TS型LVCMOS時鐘緩沖器產(chǎn)品說明書
- 386.75 KB | 1次下載 | 免費
- 460KW電機控制器硬件驅動電路設計(可下載)
- 720.01 KB | 1次下載 | 免費
- 5LTS4008TE N溝道增強型功率MOSFET規(guī)格書
- 1.05 MB | 次下載 | 免費
- 6LTD1534MFJ-X N溝道增強型功率MOSFET規(guī)格書
- 1.72 MB | 次下載 | 免費
- 7Best Sound用戶手冊
- 6.29 MB | 次下載 | 免費
- 8LT2002EFOQA帶ESD保護的共漏雙通道N溝道MOSFET規(guī)格書
- 1.49 MB | 次下載 | 免費
本月
- 1STM32CubeMX用于STM32配置和初始化C代碼生成
- 21.90 MB | 627次下載 | 免費
- 2STM32開發(fā)板教程之STM32開發(fā)指南免費下載
- 24.88 MB | 176次下載 | 3 積分
- 3EN60335-1安規(guī)標準 中文版本
- 1.86 MB | 53次下載 | 1 積分
- 4OAH0428最新規(guī)格書(中文)
- 2.52 MB | 28次下載 | 10 積分
- 5Altium-常用3D封裝庫(Step)接插件篇
- 4.95 MB | 26次下載 | 免費
- 6UHV系列雷電沖擊電壓發(fā)生器試驗裝置詳細說明使用
- 1.07 MB | 17次下載 | 免費
- 7介紹一些常用的電子元器件
- 3.20 MB | 8次下載 | 免費
- 8麻將機升降電路
- 0.12 MB | 6次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935124次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191371次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183336次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81583次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論