資料介紹
聚類分析是數據挖掘領域中一種非常有用的技術,它用于從大量數據中尋找隱含的數據分布模式,主要有分割法、層次法、密度法、網格法和模型法等。該文主要討論數據挖掘中一種基于密度和網格的聚類分析算法及其在客戶關系管理中的應用。該算法具有較高的聚類效率而且容易實現,可以發現任意形狀的聚類,時間復雜度低,聚類精度高,適用于數據的批量更新。該文還提出增量式聚類技術,它不僅能夠利用前期聚類的結果,充分提高聚類分析的效率,而且可以降低維護知識庫所帶來的巨大開銷。實驗證明了算法的有效性。
關 鍵 詞 聚類分析; 客戶關系管理; 數據挖掘; 密度; 網格
Clustering analysis is a very useful tool in the domain of data mining for searching distributing mode from a great deal of data. Its main algorithms are partition-based algorithm, hierarchy-based algorithm, density-based algorithm, grid-based algorithm, and model-based algorithm. The paper mainly discusses a clustering algorithm based on density and grid in data mining, which has high clustering efficiency and low time complexity. It is efficient and effective for multi-density and uniformity density data sets with noise and suitable for batch update. After that an incremental clustering technique is presented. This technique not only makes best use of the former clustering results and improves the efficiency of clustering analysis, but also brings to the reduction of enormous expenditure on knowledge base maintenance. At last an application of the algorithm in Customer Relationship Management (CRM) is gien.
Key words clustering analysis; customer relationship management; data mining; density; grid
聚類分析是數據挖掘領域研究的重要課題[1],其基本思想是:按照數據的相似性和差異性,將數據劃分為若干組,同組的數據盡量相似,不同組的數據盡量相異[2-3]。迄今為止,人們已經提出了許多聚類算法,主要有分割法、層次法、密度法、網格法和模型法等[4-6]。基于網格和密度的聚類算法由于易于增量實現和高維數據挖掘而被廣泛地應用于聚類算法中。基于網格的方法在聚類過程中將網格中的點作為一個整體處理,而不是考慮單元中的每一個點,基于這一特性,該方法在所有的聚類方法中效率最高。其優點是聚類的結果與輸入數據的順序無關,算法的時間復雜度是數據點個數的線性函數,速度快、可擴展性好,能識別不同形狀的聚類。
本文給出一種基于密度和網格的聚類算法,它是一個基于密度的算法,既保留了基于網格算法運行速度快的特點,又通過細化技術彌補了該類算法精度不好的弱點。
1 算法分析
在基于密度的算法中,一個聚類就是一個比周圍區域有更高數據點密度的區域[7]。為識別數據點的密度,將數據空間進行劃分并找出每個單元中數據點的數目。為使計算點的密度的方法簡單一些,將數據空間分割成網格狀,把數據空間中的每一維劃分成相同的區間數,每一個單元具有相同的“體積”[8-9]。單元中點的密度的計算可以轉換成簡單的點計數,然后把落到某個單元中的點的個數作為該單元的密度。這時可以指定一個閾值r,當某單元格中點的個數大于該閾值時,就稱該單元格是密集的,聚類也就是所有相鄰近的密集單元格的集合。
- 基于群組和密度的大規模軌跡聚類算法 2次下載
- 基于網格多密度聚類的古建筑圖像特征匹配方法 3次下載
- 一種基于自然最近鄰的密度峰值聚類算法 12次下載
- 基于MapReduce和加權網絡信息熵的DBWGIE-MR算法 11次下載
- 一種自適應的關聯融合聚類算法 13次下載
- 一種改進的聚類聯合相似度推薦算法 10次下載
- 可檢測出租車載客的軌跡聚類算法 13次下載
- 如何使用拉普拉斯中心性和密度峰值進行無參數聚類算法的研究 12次下載
- 如何融合密度峰值進行高斯混合模型聚類算法概述 2次下載
- 如何使用多維網格空間進行改進K-means聚類算法資料概述 1次下載
- 聚類算法及聚類融合算法研究 33次下載
- 基于網格的多密度聚類算法
- 基于網格的帶有參考參數的聚類算法
- 基于模糊聚類思想的網格獨立任務調度算法
- 基于不均勻密度的自動聚類算法
- 聚類分析中的機器學習與統計方法綜述(二) 799次閱讀
- 如何在 Python 中安裝和使用頂級聚類算法 472次閱讀
- 代碼實現密度聚類DBSCAN 593次閱讀
- 10種頂流聚類算法Python實現(附完整代碼) 1259次閱讀
- CCM和CRM的圖騰柱PFC哪個效率更高? 3739次閱讀
- 機器學習技術在圖像處理中的應用 2080次閱讀
- 10種聚類介紹和Python代碼 2850次閱讀
- 基于距離的聚類算法K-means的設計實現 2088次閱讀
- 淺析四類機器學習在自動駕駛中的應用 5329次閱讀
- Python無監督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述 3w次閱讀
- 機器學習中五種常用的聚類算法 3.8w次閱讀
- 淺談Matlab中的聚類分析 Matlab聚類程序的設計 7212次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 5208次閱讀
- 基于密度DBSCAN的聚類算法 2.1w次閱讀
- k means聚類算法實例 1.5w次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7基于單片機和 SG3525的程控開關電源設計
- 0.23 MB | 3次下載 | 免費
- 8基于單片機的紅外風扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多