Apriori算法簡(jiǎn)介和聚類(lèi)分析模型介紹
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
Apriori 算法的挖掘思想:Apriori 算法采用的是逐層搜素的策略,同時(shí)依據(jù)其性質(zhì)壓縮搜索空間。而它的性質(zhì)是說(shuō),如果一個(gè)項(xiàng)集具有頻繁性,則它的所有非空子集也一定是頻繁項(xiàng)集。它的基本思想在于,首先,掃描一次事物集合,找出頻繁 1 -項(xiàng)集集合 L1,然后基于 L1,產(chǎn)生所有可能的頻繁 2 -項(xiàng)集即候選集 C2,接著基于 L1 對(duì) C2 進(jìn)行必要的剪枝操作。對(duì) C2 的優(yōu)化完成后,再掃描一次事務(wù)集合,找出下一個(gè)頻繁候選集,如此迭代,直至再也找不出頻繁集時(shí)退出。
在實(shí)際的應(yīng)用中,關(guān)聯(lián)規(guī)則主要應(yīng)用于商品購(gòu)買(mǎi)的關(guān)聯(lián)行為,比如針對(duì)一個(gè)賣(mài)場(chǎng),可以通過(guò)對(duì)大數(shù)據(jù)的關(guān)聯(lián)分析發(fā)現(xiàn)面包與牛奶之間的購(gòu)買(mǎi)行為,從而可以針對(duì)性進(jìn)行促銷(xiāo)或是適當(dāng)調(diào)整商場(chǎng)的物品擺放。所以關(guān)聯(lián)分析是大數(shù)據(jù)分析特別有效的模型,針對(duì)性比較強(qiáng)。
聚類(lèi)分析模型聚類(lèi)分析
模型簡(jiǎn)介:是指將物理的或抽象的對(duì)象的集合分成相似的對(duì)象集的過(guò)程,最終的結(jié)果是同一個(gè)簇中的對(duì)象具有較高的相似性,而不同簇之間的對(duì)象則具有較大的差異性。聚類(lèi)分析的三要素為相似度測(cè)度,聚類(lèi)準(zhǔn)則和聚類(lèi)算法。相似度測(cè)度主要用于衡量同簇對(duì)象的類(lèi)似性和不同簇對(duì)象的差異性,而聚類(lèi)準(zhǔn)則則是用于評(píng)價(jià)聚類(lèi)結(jié)果的好壞,聚類(lèi)算法用于找出使準(zhǔn)則函數(shù)取極值的最好聚類(lèi)結(jié)果。目前大數(shù)據(jù)聚類(lèi)分析中比較常用的算法主要有劃分式聚類(lèi)算法、基于密度的聚類(lèi)算法、層次聚類(lèi)算法、以及基于網(wǎng)格的聚類(lèi)算法。其中比較比較典型的是劃分式聚類(lèi)算法。
劃分式聚類(lèi)算法的挖掘思想:劃分式聚類(lèi)算法的其代表是 K 均值算法、K 中心點(diǎn)算法以及它們的一些變種。K 均值聚類(lèi)算法假定所有的數(shù)據(jù)對(duì)象課分為 K 個(gè)簇,每個(gè)簇的中心用均值表示,對(duì)象間的相似性用距離度量,聚類(lèi)的準(zhǔn)則使用誤差平方和準(zhǔn)則。它的核心在于首先選定 K 個(gè)初始聚類(lèi)中心,根據(jù)最小距離原則將每個(gè)數(shù)據(jù)對(duì)象分類(lèi)到每一簇中。聚類(lèi)分析模型是一個(gè)比較簡(jiǎn)單的大數(shù)據(jù)分析模型,但是它可以對(duì)大型數(shù)據(jù)集進(jìn)行高效地劃分,它也是數(shù)據(jù)挖掘的重要模型之一,在實(shí)際工作中已經(jīng)取得廣泛的應(yīng)用,是眾多企業(yè)處理大數(shù)據(jù)不二的選擇。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
Apriori算法簡(jiǎn)介和聚類(lèi)分析模型介紹下載
相關(guān)電子資料下載
- 機(jī)器學(xué)習(xí)之關(guān)聯(lián)分析介紹 591
- Apriori關(guān)聯(lián)規(guī)則算法(Python代碼) 2766
- 從五個(gè)方面讓你了解人工智能算法中的Apriori 2021
- 十大經(jīng)典機(jī)器學(xué)習(xí)算法之一--Apriori 10048
- 十大經(jīng)典數(shù)據(jù)挖掘算法—Apriori 3273
- 數(shù)據(jù)挖掘Apriori算法報(bào)告 4829
- 關(guān)聯(lián)規(guī)則挖掘——Apriori算法的基本原理以及改進(jìn) 8863
- Apriori算法詳解 20053
- Matlab關(guān)于Apriori算法設(shè)計(jì) 4662
- 簡(jiǎn)介Apriori算法并解析該算法的具體策略和步驟,給出Python實(shí)現(xiàn)代碼 5379