資料倉庫 - 概述



資料倉庫是一箇中心儲存庫,用於儲存來自一個或多個異構資料來源的資料。資料倉庫用於資訊報告和分析,並存儲歷史資料和當前資料。DW 系統中的資料用於分析報告,業務分析師、銷售經理或知識工作者隨後將其用於決策。

DW 系統中的資料是從運營事務系統(如銷售、營銷、人力資源、供應鏈管理等)載入的。在載入到 DW 系統進行資訊處理之前,它可能會經過運營資料儲存或其他轉換。

資料倉庫 - 主要特性

DW 系統的主要特性如下:

  • 它是中心資料儲存庫,儲存來自一個或多個異構資料來源的資料。

  • DW 系統儲存當前資料和歷史資料。通常,DW 系統儲存 5-10 年的歷史資料。

  • DW 系統始終與運營事務系統分開。

  • DW 系統中的資料用於不同型別的分析報告,範圍從季度到年度比較。

DW 系統的需求

假設您有一個住房貸款機構,資料來自多個應用程式,例如營銷、銷售、ERP、人力資源、物料管理等。這些資料在資料倉庫中進行提取、轉換和載入。

例如,如果您需要比較產品的季度/年度銷售額,則不能使用運營事務資料庫,因為這會掛起事務系統。因此,為此目的使用資料倉庫。

DW 和 ODB 的區別

資料倉庫和運營資料庫(事務資料庫)的區別如下:

  • 事務系統設計用於已知的負載和事務,例如更新使用者記錄、搜尋記錄等。但是,資料倉庫事務更復雜,並提供一般形式的資料。

  • 事務系統包含組織的當前資料,而資料倉庫通常包含歷史資料。

  • 事務系統支援多個事務的並行處理。需要併發控制和恢復機制來維護資料庫的一致性。

  • 運營資料庫查詢允許讀取和修改操作(刪除和更新),而 OLAP 查詢只需要對儲存資料的只讀訪問(SELECT 語句)。

DW 架構

資料倉庫涉及資料清洗、資料整合和資料整合。

DW Architecture

資料倉庫具有三層架構:**資料來源層、整合層**和**表示層**。上圖顯示了資料倉庫系統的常見架構。

廣告