資料倉庫 - 型別



資料倉庫系統有四種類型。

  • 資料市集
  • 聯機分析處理 (OLAP)
  • 聯機事務處理 (OLTP)
  • 預測分析 (PA)

資料市集

資料市集被認為是最簡單的資料倉庫系統形式,通常包含組織中的單個功能區域,例如銷售、財務或營銷等。

組織中的資料市集由單個部門建立和管理。由於它屬於單個部門,因此該部門通常僅從少數或一種型別的來源/應用程式獲取資料。此來源可以是內部運營系統、資料倉庫或外部系統。

聯機分析處理

在 OLAP 系統中,與事務系統相比,事務數量較少。執行的查詢本質上很複雜,並且涉及資料聚合。

什麼是聚合?

如果有人需要進行逐年比較,我們會儲存具有聚合資料的表,例如年度(1 行)、季度(4 行)、每月(12 行)等,則只會處理一行。但是,在未聚合的表中,它將比較所有行。

SELECT SUM(salary)
FROM employee
WHERE title = 'Programmer';

OLAP 系統中的有效措施

響應時間被稱為OLAP系統中最有效和最關鍵的衡量標準之一。聚合的儲存資料維護在多維模式中,例如星型模式(當資料排列成層次結構組(通常稱為維度)以及事實和聚合事即時,稱為模式)。

OLAP 系統的延遲為幾個小時,而資料市集的延遲預計接近一天。

聯機事務處理

在 OLTP 系統中,有大量短的聯機事務,例如 INSERT、UPDATE 和 DELETE。

在 OLTP 系統中,有效的衡量標準是短事務的處理時間,並且非常短。它控制多訪問環境中的資料完整性。對於 OLTP 系統,每秒的事務數衡量有效性。OLTP 資料倉庫系統包含當前和詳細的資料,並以實體模型(3NF)中的模式維護。

示例

零售商店中每天的事務系統,其中客戶記錄每天都會插入、更新和刪除。它提供非常快的查詢處理。OLTP 資料庫包含詳細和當前的資料。用於儲存 OLTP 資料庫的模式是實體模型。

OLTP 和 OLAP 之間的區別

以下插圖顯示了OLTPOLAP系統之間的主要區別。

OLTP and OLAP
  • 索引 - OLTP 系統只有少量索引,而 OLAP 系統有許多索引用於效能最佳化。

  • 連線 - 在 OLTP 系統中,大量連線和資料被規範化。但是,在 OLAP 系統中,連線較少且被反規範化。

  • 聚合 - 在 OLTP 系統中,資料未聚合,而在 OLAP 資料庫中使用更多聚合。

預測分析

預測分析被稱為透過使用不同的數學函式來預測未來結果,從而在 DW 系統中儲存的資料中找到隱藏的模式。

預測分析系統在用途方面不同於 OLAP 系統。它用於關注未來的結果。OALP 系統專注於當前和歷史資料處理以進行分析報告。

廣告

© . All rights reserved.