不確定數據頻繁閉項集挖掘算法
大小:0.57 MB 人氣: 2018-01-02 需要積分:2
標簽:挖掘算法(7653)
由于不確定數據的向下封閉屬性,挖掘全部頻繁項集的方法會得到一個指數級的結果。為獲得一個較小的合適的結果集,研究了在不確定數據上挖掘頻繁閉項集,并提出了一種新的頻繁閉項集挖掘算法-NA-PFCIM。該算法將項集挖掘過程看作一個概率分布函數,考慮到基于正態分布模型的方法提取的頻繁項集精確度較高,而且支持大型數據庫,采用了正態分布模型提取頻繁項集。同時,為了減少搜索空間以及避免冗余計算,利用基于深度優先搜索的策略來獲得所有的概率頻繁閉項集。該算法還設計了兩個剪枝策略:超集修剪和子集修剪。最后,在常用的數據集( T1014DIOOK、Accidents、Mushroom、Chess)上,將提出的NA-PFCIM算法和基于泊松分布的A-PFCIM算法進行比較。實驗結果表明,NA-PFCIM算法能夠減少所要擴展的項集,同時減少項集頻繁概率的計算,其性能優于對比算法。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
不確定數據頻繁閉項集挖掘算法下載
相關電子資料下載
- 一文弄懂數據挖掘的十大算法,數據挖掘算法原理講解 706
- 數據分析的4個目的3個意義 新手小白一定要看! 3259
- 數據挖掘算法:決策樹算法如何學習及分裂剪枝 5546
- 十大經典數據挖掘算法—Apriori 3549