OLAP分類的基本概念
OLAP有多種實現方法,根據存儲數據的方式不同可以分為ROLAP、MOLAP、HOLAP。
ROLAP:表示基于關系數據庫的OLAP實現(Relational OLAP)。以關系數據庫為核心,以關系型結構進行多維數據的表示和存儲。ROLAP將多維數據庫的多維結構劃分為兩類表:一類是事實表,用來存儲數據和維關鍵字;另一類是維表,即對每個維至少使用一個表來存放維的層次、成員類別等維的描述信息。維表和事實表通過主關鍵字和外關鍵字聯系在一起,形成了“星型模式”。對于層次復雜的維,為避免冗余數據占用過大的存儲空間,可以使用多個表來描述,這種星型模式的擴展稱為“雪花模式”。ROLAP的最大好處是可以實時地從源數據中獲得最新數據更新,以保持數據實時性,缺陷在于運算效率比較低,用戶等待響應時間比較長。
MOLAP:表示基于多維數據組織的OLAP實現(Multidimensional OLAP)。以多維數據組織方式為核心,也就是說,MOLAP使用多維數組存儲數據。多維數據在存儲中將形成“數據立方體(Cube)”的結構,此結構在得到高度優化后,可以最大程度地提高查詢性能。隨著源數據的更改,MOLAP 存儲中的對象必須定期處理以合并這些更改。兩次處理之間的時間將構成滯后時間,在此期間,OLAP對象中的數據可能無法與當前源數據相匹配。維護人員可以對 MOLAP 存儲中的對象進行不中斷的增量更新。MOLAP的優勢在于由于經過了數據多維預處理,分析中數據運算效率高,主要的缺陷在于數據更新有一定延滯。
HOLAP:表示基于混合數據組織的OLAP實現(Hybrid OLAP),用戶可以根據自己的業務需求,選擇哪些模型采用ROLAP,哪些采用MOLAP。一般來說,會將非常用或需要靈活定義的分析使用ROLAP方式,而常用、常規模型采用MOLAP實現。
Cubes:是數據立方體。何為數據立方體?這主要是和維度的概念一起理解,我們現實是分三維,x,y,z三個坐標決定的空間。而數據庫,可能會包含很多維度,只是在我們的認知中無法想像超越三維的事物,這只是個概念。可見,Cube是依賴于維度的。所以在我們建立Cube的時候,需要理解下面的Dimension是什么。
Dimensions:Cube的維度,每個Cube依賴哪些維度來做統計,就需要在這里建。雖然在創建立方的時候會自動幫我們創建維度,但是有時候他創建的維度并不能達到我們的目的。所以,我們先建Dimension,再建Cube。
Mining structures:數據挖掘用的東西,咱這里就不說了,因為我還沒用過,只是看了下Webcast的視頻,里面介紹了集成了大量的現有挖掘算法,很方便的可以做出相應的分析趨勢。 還是看似厲啊。
OLAP的基本操作
我們已經知道OLAP的操作是以查詢——也就是數據庫的SELECT操作為主,但是查詢可以很復雜,比如基于關系數據庫的查詢可以多表關聯,可以使用COUNT、SUM、AVG等聚合函數。OLAP正是基于多維模型定義了一些常見的面向分析的操作類型是這些操作顯得更加直觀。
OLAP的多維分析操作包括:鉆取(Drill-down)、上卷(Roll-up)、切片(Slice)、切塊(Dice)以及旋轉(Pivot),下面還是以上面的數據立方體為例來逐一解釋下:
鉆取(Drill-down):在維的不同層次間的變化,從上層降到下一層,或者說是將匯總數據拆分到更細節的數據,比如通過對2010年第二季度的總銷售數據進行鉆取來查看2010年第二季度4、5、6每個月的消費數據,如上圖;當然也可以鉆取浙江省來查看杭州市、寧波市、溫州市……這些城市的銷售數據。
基本分析操作
OLAP允許用戶從多種角度分析多維數據,主要包括以下五種基本操作:上卷(consolidation/roll-up)、下鉆(drill-down)、切片(slice)、切塊(dice)和旋轉(pivot)。
上卷(consolidation/Roll-up)
上卷表示沿著某一維度按照一定的規則(rule)對數據進行聚合(aggregation)操作,沿著某一維度,即按照層級關系從子類維度向父類維度作聚合。
下鉆(Drill-down)
下鉆和上卷正好相反,允許用戶從已聚合的數據集中提取出所關注的細節。下圖表示了從“Outdoor-Schutzausrüstung”這個父類維度中抽取出三個子類維度的下鉆過程。
切片(Slice)
切片表示通過選擇某個維度的單一值(value),從OLAP cube中抽取出一個分片的過程。下圖表示了從原始OLAP cube中抽取出time = 2004分片的過程。
切塊(Dice)
切塊表示通過選擇多個維度的某些值(或者區間),從OLAP cube中抽取出子cube的過程。下圖表示了從原始OLAP cube中抽取某個維度中多值對應的子cube的過程。
旋轉(pivot)
旋轉操作允許用戶通過旋轉(rotate)OLAP cube,重新選擇目標分析維度,通常表現為交換坐標軸操作。在下圖中,原始的OLAP cube的X軸是產品名稱,Y軸是地區名稱,Z軸是年份;經過旋轉操作后cube表示了每個產品在不同年份、不同地區的統計情況。
評論
查看更多