資料介紹
聚類分析是數據挖掘領域中一種非常有用的技術,它用于從大量數據中尋找隱含的數據分布模式,主要有分割法、層次法、密度法、網格法和模型法等。該文主要討論數據挖掘中一種基于密度和網格的聚類分析算法及其在客戶關系管理中的應用。該算法具有較高的聚類效率而且容易實現,可以發現任意形狀的聚類,時間復雜度低,聚類精度高,適用于數據的批量更新。該文還提出增量式聚類技術,它不僅能夠利用前期聚類的結果,充分提高聚類分析的效率,而且可以降低維護知識庫所帶來的巨大開銷。實驗證明了算法的有效性。
關 鍵 詞 聚類分析; 客戶關系管理; 數據挖掘; 密度; 網格
Clustering analysis is a very useful tool in the domain of data mining for searching distributing mode from a great deal of data. Its main algorithms are partition-based algorithm, hierarchy-based algorithm, density-based algorithm, grid-based algorithm, and model-based algorithm. The paper mainly discusses a clustering algorithm based on density and grid in data mining, which has high clustering efficiency and low time complexity. It is efficient and effective for multi-density and uniformity density data sets with noise and suitable for batch update. After that an incremental clustering technique is presented. This technique not only makes best use of the former clustering results and improves the efficiency of clustering analysis, but also brings to the reduction of enormous expenditure on knowledge base maintenance. At last an application of the algorithm in Customer Relationship Management (CRM) is gien.
Key words clustering analysis; customer relationship management; data mining; density; grid
聚類分析是數據挖掘領域研究的重要課題[1],其基本思想是:按照數據的相似性和差異性,將數據劃分為若干組,同組的數據盡量相似,不同組的數據盡量相異[2-3]。迄今為止,人們已經提出了許多聚類算法,主要有分割法、層次法、密度法、網格法和模型法等[4-6]。基于網格和密度的聚類算法由于易于增量實現和高維數據挖掘而被廣泛地應用于聚類算法中。基于網格的方法在聚類過程中將網格中的點作為一個整體處理,而不是考慮單元中的每一個點,基于這一特性,該方法在所有的聚類方法中效率最高。其優點是聚類的結果與輸入數據的順序無關,算法的時間復雜度是數據點個數的線性函數,速度快、可擴展性好,能識別不同形狀的聚類。
本文給出一種基于密度和網格的聚類算法,它是一個基于密度的算法,既保留了基于網格算法運行速度快的特點,又通過細化技術彌補了該類算法精度不好的弱點。
1 算法分析
在基于密度的算法中,一個聚類就是一個比周圍區域有更高數據點密度的區域[7]。為識別數據點的密度,將數據空間進行劃分并找出每個單元中數據點的數目。為使計算點的密度的方法簡單一些,將數據空間分割成網格狀,把數據空間中的每一維劃分成相同的區間數,每一個單元具有相同的“體積”[8-9]。單元中點的密度的計算可以轉換成簡單的點計數,然后把落到某個單元中的點的個數作為該單元的密度。這時可以指定一個閾值r,當某單元格中點的個數大于該閾值時,就稱該單元格是密集的,聚類也就是所有相鄰近的密集單元格的集合。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
- 基于群组和密度的大规模轨迹聚类算法2次下载
- 基于网格多密度聚类的古建筑图像特征匹配方法3次下载
- 一种基于自然最近邻的密度峰值聚类算法12次下载
- 基于MapReduce和加权网络信息熵的DBWGIE-MR算法11次下载
- 一种自适应的关联融合聚类算法13次下载
- 一种改进的聚类联合相似度推荐算法10次下载
- 可检测出租车载客的轨迹聚类算法13次下载
- 如何使用拉普拉斯中心性和密度峰值进行无参数聚类算法的研究12次下载
- 如何融合密度峰值进行高斯混合模型聚类算法概述2次下载
- 如何使用多维网格空间进行改进K-means聚类算法资料概述1次下载
- 聚类算法及聚类融合算法研究33次下载
- 基于网格的多密度聚类算法11次下载
- 基于网格的带有参考参数的聚类算法9次下载
- 基于模糊聚类思想的网格独立任务调度算法14次下载
- 基于不均匀密度的自动聚类算法16次下载
- 聚类分析中的机器学习与统计方法综述(二)1833次阅读
- 如何在 Python 中安装和使用顶级聚类算法851次阅读
- 代码实现密度聚类DBSCAN1023次阅读
- 10种顶流聚类算法Python实现(附完整代码)2167次阅读
- CCM和CRM的图腾柱PFC哪个效率更高?5017次阅读
- 机器学习技术在图像处理中的应用2775次阅读
- 10种聚类介绍和Python代码6287次阅读
- 基于距离的聚类算法K-means的设计实现2631次阅读
- 浅析四类机器学习在自动驾驶中的应用5851次阅读
- Python无监督学习的几种聚类算法包括K-Means聚类,分层聚类等详细概述30841次阅读
- 机器学习中五种常用的聚类算法38630次阅读
- 浅谈Matlab中的聚类分析 Matlab聚类程序的设计7577次阅读
- 一种基于MapReduce模型的并行化k-medoids聚类算法5665次阅读
- 基于密度DBSCAN的聚类算法22141次阅读
- k means聚类算法实例16117次阅读
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7基于單片機和 SG3525的程控開關電源設計
- 0.23 MB | 3次下載 | 免費
- 8基于單片機的紅外風扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論