什麼是資料倉庫?


資料倉庫是一種主要用於收集和管理來自各種來源的資料的技術,以便為企業提供有意義的商業洞察力。資料倉庫專門設計用於支援管理決策。

簡單來說,資料倉庫定義了一個獨立於組織運營資料庫維護的資料庫。資料倉庫系統能夠整合多個應用程式系統。它們透過提供可靠的整合歷史資訊平臺進行分析,從而提供資料處理。

資料倉庫在多維空間中概括和集中資料。資料倉庫的構建包含資料清洗、資料整合和資料轉換,可以看作是資料探勘的重要預處理步驟。

它提供聯機分析處理 (OLAP) 工具,用於互動式分析各種粒度的多維資料,這有助於有效的資料概括和資料探勘。幾種資料探勘功能,包括關聯、分類、預測和聚類,可以與 OLAP 操作整合,以構建不同抽象級別的互動式知識挖掘。

資料倉庫主要有三種類型,如下所示:

企業資料倉庫 (EDW) − 企業資料倉庫是一個集中式倉庫。它用於組織和表示資料。藉助 EDW,使用者可以根據主題對資料進行分類。

運營資料儲存 − 在運營資料儲存中,資料倉庫即時重新整理。因此,它更常用於包括儲存記錄等日常活動。

資料市集 − 資料市集可以定義為資料倉庫的子集。它專為銷售、財務等設計。

資料倉庫的特徵

資料倉庫有以下幾種特徵:

  • 面向主題 − 資料倉庫的目標是為決策者建模和分析資訊。因此,資料倉庫通常透過排除對決策支援過程沒有幫助的資訊,提供對特定主題問題的簡單明瞭的檢視。

  • 整合性 − 由於資料倉庫通常是透過整合多個異構來源(例如關係資料庫、平面檔案和聯機事務記錄)構建的,因此需要使用資料清洗和資料整合技術來保證命名約定、編碼機制、屬性度量等的一致性。

  • 隨時間變化 − 儲存資料是為了提供從歷史角度來看的資料(例如,過去 5-10 年)。資料倉庫中的每個關鍵機制都隱式或顯式地包含時間元素。

  • 非易失性 − 資料倉庫始終是從運營環境中找到的軟體資料轉換而來的物理獨立資料儲存。由於這種分離,資料倉庫不需要事務處理、恢復和併發控制結構。它通常只需要兩種資料訪問操作——初始資料載入和資料訪問。

更新於:2021年11月22日

769 次瀏覽

開啟你的職業生涯

透過完成課程獲得認證

開始學習
廣告
© . All rights reserved.