大數(shù)據(jù)技術,簡而言之,就是提取大數(shù)據(jù)價值的技術,是根據(jù)特定目標,經(jīng)過數(shù)據(jù)收集與存儲、數(shù)據(jù)篩選、算法分析與預測、數(shù)據(jù)分析結(jié)果展示等,為做出正確決策提供依據(jù),其數(shù)據(jù)級別通常在PB以上,今天我們就來了解一下,大數(shù)據(jù)技術在企業(yè)應用中都有哪些表現(xiàn)形式。
1、數(shù)據(jù)分析及挖掘
數(shù)據(jù)統(tǒng)計及分析主要是基于存儲的海量數(shù)據(jù)進行普通的分析和分類匯總,以滿足大多數(shù)常見的分析需求。數(shù)據(jù)挖掘一般沒有預先設定好的主題,主要是在現(xiàn)有數(shù)據(jù)上面進行基于各種算法的計算,從而起到預測的效果,實現(xiàn)高級別的數(shù)據(jù)分析的需求,豐富的歷史數(shù)據(jù)是數(shù)據(jù)挖掘的先決條件。比較典型的算法有回歸、分類、聚類、關聯(lián)分析。機器學習正是如此,分為監(jiān)督式學習算法、無監(jiān)督式學習算法、半監(jiān)督式學習算法。
2、機器學習
監(jiān)督式學習算法是從帶標簽(標注)的訓練樣本中建立的訓練樣本中建立模式,并依此推測新的數(shù)據(jù)標簽的算法。比如回歸、神經(jīng)網(wǎng)絡、決策樹、支持向量機、貝葉斯、隨機森林。無監(jiān)督式學習算法是在學習時并不知道其分類結(jié)果,目的是去對原始資料進行分類,以便了解資料內(nèi)部結(jié)構(gòu)的算法。比如聚類、主成分分析、線性判別分析降維。半監(jiān)督式學習算法是利用少量標注樣本和大量未標注樣本進行機器學習,利用數(shù)據(jù)分布上的模型假設,建立學習器對未標簽樣本進行標簽。
3、數(shù)據(jù)倉庫
從企業(yè)角度來說,無論是數(shù)據(jù)庫、數(shù)據(jù)倉庫還是大數(shù)據(jù)都是解決不同需求、處理不同級別數(shù)據(jù)量的技術,它們之間并無沖突。針對不同需求和現(xiàn)狀進行技術選擇,各種技術相互補充、相互協(xié)作。目前階段對于大部分企業(yè)來說,想要開展一個全新的大數(shù)據(jù)項目似乎無從下手。從現(xiàn)有數(shù)據(jù)倉庫建設理論和經(jīng)驗入手,引入部分大數(shù)據(jù)技術,特別是實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的收集、存儲和處理是一種比較可行的方法。
4、數(shù)據(jù)安全
大數(shù)據(jù)蘊藏著價值信息,但數(shù)據(jù)安全面臨著嚴峻挑戰(zhàn)。一方面,大數(shù)據(jù)本身的安全防護存在漏洞。雖然云計算對大數(shù)據(jù)提供了便利,但對大數(shù)據(jù)的安全控制力度不夠,API訪問權(quán)限控制以及密鑰生產(chǎn),存儲和管理方面的不足都可能造成數(shù)據(jù)泄露。另一方面,在用數(shù)據(jù)挖掘和數(shù)據(jù)分析等大數(shù)據(jù)技術獲取價值信息的同時,攻擊者也在利用這些大數(shù)據(jù)技術進行攻擊。
大數(shù)據(jù)技術的表現(xiàn)形式有哪些.中琛魔方大數(shù)據(jù)分析平臺表示大數(shù)據(jù)技術能夠?qū)㈦[藏于海量數(shù)據(jù)中的信息和知識挖掘出來,為人類的社會經(jīng)濟活動提供依據(jù),從而提高各個領域的運行效率,大大提高整個社會經(jīng)濟的集約化程度。
責任編輯:gt
-
存儲
+關注
關注
13文章
4298瀏覽量
85812 -
機器學習
+關注
關注
66文章
8408瀏覽量
132580 -
大數(shù)據(jù)
+關注
關注
64文章
8884瀏覽量
137411
發(fā)布評論請先 登錄
相關推薦
評論