資料介紹
Web 文本挖掘是Web 數(shù)據(jù)挖掘的一個(gè)重要研究領(lǐng)域。文本挖掘的主要方法是文本分類(lèi)
和聚類(lèi)。本文主要討論了在文本挖掘中文本的表示,以及文本聚類(lèi)的算法描述。
關(guān)鍵詞:Web 文本挖掘,分類(lèi),聚類(lèi)
隨著 Internet 的迅速發(fā)展及Web 的全球普及,使得Web 上的信息量無(wú)比豐富,通過(guò)對(duì)Web
的挖掘,可以對(duì)Web 上的大量數(shù)據(jù)進(jìn)行分析和處理,以便識(shí)別、分析、獲取、存儲(chǔ)有用信息,并將其轉(zhuǎn)化為知識(shí)。Web 挖掘依靠它所挖掘的站點(diǎn)信息來(lái)源可以分為三類(lèi):Web 內(nèi)容挖掘、Web 結(jié)構(gòu)挖掘和Web 使用挖掘。
Web 內(nèi)容挖掘研究的對(duì)象是網(wǎng)頁(yè)本身的內(nèi)容以及Web 搜索的結(jié)果。Web 的頁(yè)面信息主
要包括文本信息和多媒體信息,所以挖掘主要包括對(duì)頁(yè)面文本信息的挖掘和多媒體挖掘,其中以Web 文本內(nèi)容挖掘?yàn)橹鳌6W(wǎng)頁(yè)中最主要的信息資源是文本,因此Web 文本挖掘又成為Web 數(shù)據(jù)挖掘的一個(gè)重要研究領(lǐng)域。
和聚類(lèi)。本文主要討論了在文本挖掘中文本的表示,以及文本聚類(lèi)的算法描述。
關(guān)鍵詞:Web 文本挖掘,分類(lèi),聚類(lèi)
隨著 Internet 的迅速發(fā)展及Web 的全球普及,使得Web 上的信息量無(wú)比豐富,通過(guò)對(duì)Web
的挖掘,可以對(duì)Web 上的大量數(shù)據(jù)進(jìn)行分析和處理,以便識(shí)別、分析、獲取、存儲(chǔ)有用信息,并將其轉(zhuǎn)化為知識(shí)。Web 挖掘依靠它所挖掘的站點(diǎn)信息來(lái)源可以分為三類(lèi):Web 內(nèi)容挖掘、Web 結(jié)構(gòu)挖掘和Web 使用挖掘。
Web 內(nèi)容挖掘研究的對(duì)象是網(wǎng)頁(yè)本身的內(nèi)容以及Web 搜索的結(jié)果。Web 的頁(yè)面信息主
要包括文本信息和多媒體信息,所以挖掘主要包括對(duì)頁(yè)面文本信息的挖掘和多媒體挖掘,其中以Web 文本內(nèi)容挖掘?yàn)橹鳌6W(wǎng)頁(yè)中最主要的信息資源是文本,因此Web 文本挖掘又成為Web 數(shù)據(jù)挖掘的一個(gè)重要研究領(lǐng)域。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 基于注意力機(jī)制的新聞文本分類(lèi)模型 30次下載
- 基于LSTM的表示學(xué)習(xí)-文本分類(lèi)模型 18次下載
- 基于主題分布優(yōu)化的模糊文本分類(lèi)方法 5次下載
- 基于不同神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)方法研究對(duì)比 48次下載
- 融合文本分類(lèi)和摘要的多任務(wù)學(xué)習(xí)摘要模型 11次下載
- 一種基于BERT模型的社交電商文本分類(lèi)算法 8次下載
- 基于BP神經(jīng)網(wǎng)絡(luò)分類(lèi)器的垃圾文本過(guò)濾模型 43次下載
- 結(jié)合BERT模型的中文文本分類(lèi)算法 6次下載
- 基于深度神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)分析 37次下載
- 如何使用Spark計(jì)算框架進(jìn)行分布式文本分類(lèi)方法的研究 3次下載
- 基于標(biāo)題的文本自動(dòng)分類(lèi)研究 0次下載
- 基于Rough集的web文本分類(lèi)研究
- 用于文本分類(lèi)和文本聚類(lèi)的特征抽取方法的研究
- 一種適應(yīng)短文本的相關(guān)測(cè)度及其應(yīng)用
- 基于危險(xiǎn)理論的web文本挖掘研究
- 卷積神經(jīng)網(wǎng)絡(luò)在文本分類(lèi)領(lǐng)域的應(yīng)用 358次閱讀
- 交換機(jī)的分類(lèi)及其特點(diǎn) 852次閱讀
- 繼電器的分類(lèi)及其特點(diǎn) 1797次閱讀
- 人工智能中文本分類(lèi)的基本原理和關(guān)鍵技術(shù) 947次閱讀
- 常用傳感器分類(lèi)及其應(yīng)用 3140次閱讀
- 面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)研究 481次閱讀
- Linux系統(tǒng)中的10個(gè)常用的文本查看命令 1w次閱讀
- 基于文本到圖像模型的可控文本到視頻生成 801次閱讀
- Web的應(yīng)用基礎(chǔ) 645次閱讀
- 文本分類(lèi)中處理樣本不均衡和提升模型魯棒性的trick 905次閱讀
- 帶你從頭構(gòu)建文本分類(lèi)器 3288次閱讀
- 電氣工作原理圖及其符號(hào)所表示的含義 2.5w次閱讀
- 如何為文本分類(lèi)任務(wù)選擇正確的模型,這里有一個(gè)完整流程圖! 1.2w次閱讀
- 詳細(xì)解析scikit-learn進(jìn)行文本分類(lèi) 4626次閱讀
- LED數(shù)碼管顯示分類(lèi)及其典型應(yīng)用電路 1.1w次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1490次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費(fèi)
- 6基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
- 7基于單片機(jī)和 SG3525的程控開(kāi)關(guān)電源設(shè)計(jì)
- 0.23 MB | 3次下載 | 免費(fèi)
- 8基于單片機(jī)的紅外風(fēng)扇遙控
- 0.23 MB | 3次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專(zhuān)業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論
查看更多