資料倉庫 - OLAP



聯機分析處理伺服器(OLAP)基於多維資料模型。它允許管理人員和分析師透過快速、一致和互動的方式訪問資訊,從而深入瞭解資訊。本章涵蓋OLAP的型別、OLAP的操作、OLAP與統計資料庫以及OLTP之間的區別。

OLAP伺服器的型別

我們有四種類型的OLAP伺服器:

  • 關係型OLAP(ROLAP)
  • 多維OLAP(MOLAP)
  • 混合OLAP(HOLAP)
  • 專用SQL伺服器

關係型OLAP

ROLAP伺服器位於關係後端伺服器和客戶端前端工具之間。為了儲存和管理倉庫資料,ROLAP使用關係型或擴充套件關係型DBMS。

ROLAP包括以下內容:

  • 聚合導航邏輯的實現。
  • 針對每個DBMS後端的最佳化。
  • 其他工具和服務。

多維OLAP

MOLAP使用基於陣列的多維儲存引擎來實現資料的多維檢視。使用多維資料儲存,如果資料集稀疏,則儲存利用率可能會降低。因此,許多MOLAP伺服器使用兩級資料儲存表示來處理密集和稀疏資料集。

混合OLAP

混合OLAP是ROLAP和MOLAP的組合。它提供了ROLAP更高的可擴充套件性和MOLAP更快的計算速度。HOLAP伺服器允許儲存大量詳細資訊的詳細資訊。聚合分別儲存在MOLAP儲存中。

專用SQL伺服器

專用SQL伺服器為只讀環境中星型和雪花模式上的SQL查詢提供高階查詢語言和查詢處理支援。

OLAP操作

由於OLAP伺服器基於資料的多維檢視,因此我們將討論多維資料中的OLAP操作。

以下是OLAP操作的列表:

  • 上卷
  • 下鑽
  • 切片和切塊
  • 旋轉

上卷

上卷對資料立方體進行以下任何一種方式的聚合:

  • 透過沿著維度概念層次向上移動
  • 透過減少維度

下圖說明了上卷的工作原理。

Roll-up
  • 上卷是透過沿著維度“位置”的概念層次向上移動來執行的。

  • 最初的概念層次是“街道 < 城市 < 省份 < 國家”。

  • 在上卷時,資料透過從城市級別到國家級別上移位置層次結構來聚合。

  • 資料被分組到城市而不是國家。

  • 執行上卷時,將從資料立方體中刪除一個或多個維度。

下鑽

下鑽是上卷的反向操作。它透過以下任何一種方式執行:

  • 透過沿著維度概念層次向下移動
  • 透過引入新維度。

下圖說明了下鑽的工作原理:

Drill-Down
  • 下鑽是透過沿著維度“時間”的概念層次向下移動來執行的。

  • 最初的概念層次是“天 < 月 < 季度 < 年”。

  • 在下鑽時,時間維度從季度級別下降到月級別。

  • 執行下鑽時,將向資料立方體中新增一個或多個維度。

  • 它將資料從不太詳細的資料導航到高度詳細的資料。

切片

切片操作從給定的立方體中選擇一個特定的維度並提供一個新的子立方體。考慮以下顯示切片工作原理的圖。

Slice
  • 此處,對維度“時間”執行切片,使用條件“時間=Q1”。

  • 它將透過選擇一個或多個維度來形成一個新的子立方體。

切塊

切塊從給定的立方體中選擇兩個或多個維度並提供一個新的子立方體。考慮以下顯示切塊操作的圖。

Dice

基於以下選擇條件對立方體進行切塊操作涉及三個維度。

  • (位置=“多倫多”或“溫哥華”)
  • (時間=“Q1”或“Q2”)
  • (專案=“手機”或“調變解調器”)

旋轉

旋轉操作也稱為旋轉。它旋轉檢視中的資料軸,以便提供資料的替代表示。考慮以下顯示旋轉操作的圖。

Pivot

OLAP 與 OLTP

序號 資料倉庫(OLAP) 操作資料庫(OLTP)
1 涉及資訊的歷時處理。 涉及日常處理。
2 OLAP系統由知識工作者(如高管、經理和分析師)使用。 OLTP系統由職員、DBA或資料庫專業人員使用。
3 有助於分析業務。 有助於運營業務。
4 它側重於資訊輸出。 它側重於資料輸入。
5 基於星型模式、雪花模式和事實星座模式。 基於實體關係模型。
6 包含歷史資料。 包含當前資料。
7 提供彙總和合並的資料。 提供原始和高度詳細的資料。
8 提供資料的彙總和多維檢視。 提供資料的詳細和平面關係檢視。
9 使用者數量為數百。 使用者數量為數千。
10 訪問的記錄數量為數百萬。 訪問的記錄數量為數十。
11 資料庫大小從100 GB到1 TB 資料庫大小從100 MB到1 GB。
12 高度靈活。 提供高效能。
廣告

© . All rights reserved.