資料倉庫 - 流程管理器



流程管理器負責維護資料進出資料倉庫的流程。有三種不同型別的流程管理器:

  • 載入管理器
  • 倉庫管理器
  • 查詢管理器

資料倉庫載入管理器

載入管理器執行將資料提取並載入到資料庫中所需的運算。載入管理器的規模和複雜性在不同資料倉庫的特定解決方案之間有所不同。

載入管理器架構

載入管理器執行以下功能:

  • 從源系統提取資料。

  • 將提取的資料快速載入到臨時資料儲存中。

  • 執行簡單的轉換,使其結構類似於資料倉庫中的結構。

Load Manager

從源提取資料

資料從運營資料庫或外部資訊提供者提取。閘道器是用於提取資料的應用程式程式。它由底層 DBMS 支援,並允許客戶端程式生成在伺服器上執行的 SQL。開放資料庫連線 (ODBC) 和 Java 資料庫連線 (JDBC) 是閘道器的示例。

快速載入

  • 為了最大程度地減少總載入視窗,需要以儘可能快的速度將資料載入到倉庫中。

  • 轉換會影響資料處理速度。

  • 在應用轉換和檢查之前,將資料載入到關係資料庫中更有效。

  • 閘道器技術不適用,因為在涉及大量資料時效率低下。

簡單轉換

在載入過程中,可能需要執行簡單的轉換。完成簡單的轉換後,我們可以進行復雜的檢查。假設我們正在載入 EPOS 銷售交易,我們需要執行以下檢查:

  • 刪除倉庫中不需要的所有列。
  • 將所有值轉換為所需的資料型別。

倉庫管理器

倉庫管理器負責倉庫管理過程。它包括第三方系統軟體、C 程式和 shell 指令碼。倉庫管理器的規模和複雜性在特定解決方案之間有所不同。

倉庫管理器架構

倉庫管理器包括以下內容:

  • 控制流程
  • 儲存過程或帶 SQL 的 C
  • 備份/恢復工具
  • SQL 指令碼
Warehouse Manager

倉庫管理器的功能

倉庫管理器執行以下功能:

  • 分析資料以執行一致性和引用完整性檢查。

  • 針對基礎資料建立索引、業務檢視、分割槽檢視。

  • 生成新的聚合並更新現有的聚合。

  • 生成規範化。

  • 將臨時儲存的源資料轉換併合併到已釋出的資料倉庫中。

  • 備份資料倉庫中的資料。

  • 存檔已達到其捕獲生命週期末尾的資料。

注意 - 倉庫管理器分析查詢配置檔案以確定索引和聚合是否合適。

查詢管理器

查詢管理器負責將查詢引導到合適的表。透過將查詢引導到適當的表,它可以加快查詢請求和響應過程。此外,查詢管理器還負責排程使用者釋出的查詢的執行。

查詢管理器架構

查詢管理器包括以下元件:

  • 透過 C 工具或 RDBMS 進行查詢重定向
  • 儲存過程
  • 查詢管理工具
  • 透過 C 工具或 RDBMS 進行查詢排程
  • 透過第三方軟體進行查詢排程
Query Manager

查詢管理器的功能

  • 它以使用者理解的形式向用戶呈現資料。

  • 它安排終端使用者釋出的查詢的執行。

  • 它儲存查詢配置檔案,以允許倉庫管理器確定哪些索引和聚合是合適的。

廣告

© . All rights reserved.