數(shù)據(jù)挖掘的特點是什么
1、基于大量數(shù)據(jù)
并非說小數(shù)據(jù)量上就不可以進行挖掘,實際上大多數(shù)數(shù)據(jù)挖掘的算法都可以在小數(shù)據(jù)量上運行并得到結(jié)果。但是,一方面過小的數(shù)據(jù)量完全可以通過人工分析來總結(jié)規(guī)律,另一方面來說,小數(shù)據(jù)量常常無法反映出真實世界中的普遍特性。
2、非平凡性
所謂非平凡,指的是挖掘出來的知識應(yīng)該是不簡單的,絕不能是類似某著名體育評論員所說的“經(jīng)過我的計算,我發(fā)現(xiàn)了一個有趣的現(xiàn)象,到本場比賽結(jié)束為止,這屆世界杯的進球數(shù)和失球數(shù)是一樣的。非常的巧合!”那種知識。這點看起來勿庸贅言,但是很多不懂業(yè)務(wù)知識的數(shù)據(jù)挖掘新手卻常常犯這種錯誤。
3、隱含性
數(shù)據(jù)挖掘是要發(fā)現(xiàn)深藏在數(shù)據(jù)內(nèi)部的知識,而不是那些直接浮現(xiàn)在數(shù)據(jù)表面的信息。常用的BI工具,例如報表和OLAP,完全可以讓用戶找出這些信息。
4、新奇性
挖掘出來的知識應(yīng)該是以前未知的,否則只不過是驗證了業(yè)務(wù)專家的經(jīng)驗而已。只有全新的知識,才可以幫助企業(yè)獲得進一步的洞察力。
5、價值性
挖掘的結(jié)果必須能給企業(yè)帶來直接的或間接的效益。有人說數(shù)據(jù)挖掘只是“屠龍之技”,看起來神乎其神,卻什么用處也沒有。這只是一種誤解,不可否認的是在一些數(shù)據(jù)挖掘項目中,或者因為缺乏明確的業(yè)務(wù)目標,或者因為數(shù)據(jù)質(zhì)量的不足,或者因為人們對改變業(yè)務(wù)流程的抵制,或者因為挖掘人員的經(jīng)驗不足,都會導(dǎo)致效果不佳甚至完全沒有效果。但大量的成功案例也在證明,數(shù)據(jù)挖掘的確可以變成提升效益的利器。
-
數(shù)據(jù)挖掘
+關(guān)注
關(guān)注
1文章
406瀏覽量
24232
發(fā)布評論請先 登錄
相關(guān)推薦
評論