數據分析也好,統計分析也好,數據挖掘也好、商業智能也好都需要在學習的時候掌握各種分析手段和技能,特別是要掌握分析軟件工具!學習數據分析,一般是先學軟件開始,再去應用,再學會理論和原理!沒有軟件的方法就不去學了,因為學了也不能做,除非你自己會編程序。
SPSS、SAS都是用于統計分析,圍繞統計學知識的一些基本應用,包括描述統計,方差分析,因子分析,主成分分析,基本的回歸,分布的檢驗等等。SPSS用于市場研究較多,SAS銀行金融和醫學統計較多,有一些難度。
R語言像是綜合性較強的一類數據分析工具,集統計分析、數據挖掘,數據可視化。
展開來,講講數據分析~
這些數據分析工具的使用還是看需求,每個企業應用的選擇和方式都不同。數據分析的概念很廣,站在IT的角度,實際應用中可以把數據分析工具分成兩個維度:
第一維度:數據存儲層——數據報表層——數據分析層——數據展現層
第二維度:用戶級——部門級——企業級——BI級
1、數據存儲層
數據存儲設計到數據庫的概念和數據庫語言,這方面不一定要深鉆研,但至少要理解數據的存儲方式,數據的基本結構和數據類型。SQL查詢語言必不可少,精通最好。可從常用的selece查詢,update修改,delete刪除,insert插入的基本結構和讀取入手。
Access2003、Access07等,這是最基本的個人數據庫,經常用于個人或部分基本的數據存儲;MySQL數據庫,這個對于部門級或者互聯網的數據庫應用是必要的,這個時候關鍵掌握數據庫的庫結構和SQL語言的數據查詢能力;
SQL Server2005或更高版本,對中小企業,一些大型企業也可以采用SQL Server數據庫,其實這個時候本身除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了;
DB2,Oracle數據庫都是大型數據庫,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,一般大型數據庫公司都提供非常好的數據整合應用平臺;
BI級別,實際上這個不是數據庫,而是建立在前面數據庫基礎上的,企業級應用的數據倉庫。Data Warehouse,建立在DW機上的數據存儲基本上都是商業智能平臺,整合了各種數據分析,報表、分析和展現,BI級別的數據倉庫結合BI產品也是近幾年的大趨勢。
2、報表/BI層
企業存儲了數據需要讀取,需要展現,報表工具是最普遍應用的工具,尤其是在國內。過去傳統報表大多解決的是展現問題,如今像帆軟報表FineReport也會和其他應用交叉,做數據分析報表,通過接口開放功能、填報、決策報表功能,能夠做到打通數據的進出,涵蓋了早期商業智能的功能。
Tableau、Qlikview、FineBI這類BI工具,可分在報表層也可分為數據展現層,涵蓋了數據整合、數據分析和數據展現。FineBI和Tableau同屬于近年來非常棒的軟件,可作為可視化數據分析軟件,可常用FineBI從數據庫中取數進行報表和可視化分析。相對而言,可視化Tableau更優,但FineBI又有另一種身份——商業智能,所以在大數據處理方面的能力更勝一籌。
3、數據分析層
這個層其實有很多分析工具,當然我們最常用的就是Excel。
Excel軟件,首先版本越高越好用這是肯定的;當然對excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟件;
SPSS軟件:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟件包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成為了預測分析軟件;
SAS軟件:SAS相對SPSS其實功能更強大,SAS是平臺化的,EM挖掘模塊平臺整合,相對來講,SAS比較難學些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設計等還是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收獲的!
JMP分析:SAS的一個分析分支
XLstat:Excel的插件,可以完成大部分SPSS統計分析功能
4、表現層
表現層也叫數據可視化,以上每種工具都幾乎提供了一點展現功能。FineBI和Tableau的可視化功能上文有提過。其實,近年來Excel的可視化越來越棒,配上一些插件,使用感更佳。
PPT:辦公常用,用來寫數據分析報告;
Xmind&百度腦圖:梳理流程,幫助思考分析,展現數據分析的層次;
Xcelsius軟件:Dashboard制作和數據可視化報表工具,可以直接讀取數據庫,在Excel里建模,互聯網展現,最大特色還是可以在PPT中實現動態報表。
下面詳細介紹一下7款廣泛流行的數據分析軟件平臺,幫助企業實施數據收集、數據管理、數據分析、數據挖掘,使企業根據數據做出很好的決策,主要包括SPSS數據分析軟件,SAS分析軟件,Minitab軟件,Stata統計軟件,JMP數據探索、挖掘、分析軟件,Crystal Report報表軟件, AnyReport數據分析平臺。
SPSS數據分析軟件
SPSS 英文全稱是 Statistical Product and Service Solutions,是世界上最早數據統計軟件,在1968年由美國斯坦福大學的三位研究生研發,
現今被IBM收購,并命名IBM SPSS,廣泛應用于商業數據分析。IBM SPSS是一款預測性分析軟件,包括整個分析流程:規劃、數據收集、分析、
報告和部署,它提供統計學分析和報告,預測建模、數據挖掘、決策管理與部署以及大數據分析等功能,
應用行業:銀行業、零售及消費品行業、保險業、能源與公用事業、旅游與運輸業等。
SAS分析軟件
SAS 英文全稱是Statistical Analysis System, 由美國北卡羅來納州立大學開發的統計分析軟件,它是一個模塊化、集成化的大型應用軟件系統,
它由數十個專用模塊組成,主要的功能包括數據訪問、數據儲存及管理、應用開發、圖形處理、數據分析、報告設計、運籌學方法、計量經濟學與預測等。
SAS系統大概可以分為四大部分:SAS數據庫部分;SAS核心分析工具;SAS開發展現工具;對分布模式的支持及其數據倉庫設計部分。
SAS系統主要實現了以數據為中心的四大功能:數據訪問、數據管理、數據呈現、數據分析。
應用行業:制造業、保險業、醫療保健、汽車行業、銀行業、公用事業、高科技制造業、教育等。
Minitab軟件
Minitab 是現代質量管理統計的領先者,由美國的賓夕法尼亞州州立大學研發,它供數據分析所需要的全部工具,
通過引導你選擇正確的分析方法并提供清晰的輸出報告結果。
它也提供了便捷的功能,例如簡化的工作流, 使用全面的統計量來探索數據的方法,以及可視化的圖形報表。
應用行業:金融、保險行業、電子、電信行業、電器、機械行業、運輸、物流行業、教育行業等。
Stata統計軟件
Stata統計軟件由美國計算機資源中心(Computer Resource Center)1985年研發,是一款數據分析、數據管理以及繪制專業圖表的統計分析軟件,
并與SAS、SPSS一起被稱為三大權威軟件,其特點具有數據管理、統計分析、繪制圖表、矩陣計算和程序語言,
其圖表主要包括直方圖、條形圖、百分條圖、餅圖、散點圖、散點圖矩陣、星形圖等
JMP數據探索、挖掘、分析軟件
JMP是SAS旗下業務部門之一,由1989年推出一款統計發現軟件,在桌面環境上創造了交互式的可視化功能和分析功能,
JMP涵蓋了工業統計中的所有主題:統計質量控制、可靠性及實驗設計(DOE)。 JMP的DOE最初作為附加產品的形式出現,
用于創建經典設計,之后逐漸發展成為豐富的集成環境,用于設計試驗,以期實現現有資源的最高使用效率,
JMP致力于開發各種創新功能,以幫助用戶更快地將數據可視化并理解數據,采用適當的分析并實現統計發現。
數據導入和處理從此變得輕松簡單
Crystal Report報表軟件
Crystal Report是一個功能強大的、比較流行的報表工具,一款商務智能(BI)軟件,主要用于設計及產生報表,
它有Crystal Report Designer、Crystal Report Viewer、Crystal Report Engine等重要的組件,
支持多種報表樣式:普通行列報表、主子報表,交叉表,圖形報表,支持20多種圖形:柱形圖、股票圖,漏斗圖,條形圖,餅圖,
曲線圖,甘特圖,雷達圖,氣泡圖等
AnyReport數據分析平臺
AnyReport 是一款Java開發的報表軟件,跨平臺,主要的功能包括數據收集、數據管理、業務流程、圖表設計、數據統計分析。
支持ppt、word、excel、pdf等office文件輸出,其特點可以通過瀏覽器在線設計報表、在線瀏覽報表,收集數據流程化,支持數據鉆取、挖掘、分析。
評論
查看更多