- 資料倉庫教程
- DWH - 首頁
- DWH - 概述
- DWH - 概念
- DWH - 術語
- DWH - 交付流程
- DWH - 系統流程
- DWH - 架構
- DWH - OLAP
- DWH - 關係型 OLAP
- DWH - 多維 OLAP
- DWH - 模式
- DWH - 分割槽策略
- DWH - 元資料概念
- DWH - 資料 Mart
- DWH - 系統管理員
- DWH - 流程管理員
- DWH - 安全
- DWH - 備份
- DWH - 調優
- DWH - 測試
- DWH - 未來展望
- DWH - 面試問題
- DWH 有用資源
- DWH - 快速指南
- DWH - 有用資源
- DWH - 討論
資料倉庫 - 術語
在本章中,我們將討論資料倉庫中一些最常用的術語。
元資料
元資料簡單來說就是關於資料的資料。用於表示其他資料的資料稱為元資料。例如,書籍的索引充當書籍內容的元資料。換句話說,我們可以說元資料是引導我們獲取詳細資料的彙總資料。
在資料倉庫方面,我們可以將元資料定義如下:
元資料是資料倉庫的路線圖。
資料倉庫中的元資料定義了倉庫物件。
元資料充當目錄。此目錄幫助決策支援系統找到資料倉庫的內容。
元資料倉庫
元資料倉庫是資料倉庫系統的一個組成部分。它包含以下元資料:
業務元資料 - 它包含資料所有權資訊、業務定義和變更策略。
操作元資料 - 它包括資料的有效性和資料血統。資料的有效性是指資料處於活動狀態、已歸檔或已清除。資料血統是指資料遷移的歷史記錄以及對其應用的轉換。
從操作環境到資料倉庫的對映資料 - 此元資料包括源資料庫及其內容、資料提取、資料分割槽、清洗、轉換規則、資料重新整理和清除規則。
彙總演算法 - 它包括維度演算法、粒度資料、聚合、彙總等。
資料立方體
資料立方體幫助我們以多個維度表示資料。它由維度和事實定義。維度是企業保留記錄的實體。
資料立方體的示例
假設一家公司希望藉助銷售資料倉庫跟蹤銷售記錄,並根據時間、商品、分支機構和地點進行跟蹤。這些維度允許跟蹤每月的銷售額以及商品在哪個分支機構銷售。每個維度都關聯一個表。此表稱為維度表。例如,“商品”維度表可能具有商品名稱、商品型別和商品品牌等屬性。
下表顯示了公司根據時間、商品和地點維度進行銷售資料記錄的二維檢視。
但在此二維表中,我們僅記錄了時間和商品。新德里的銷售額根據時間和商品維度顯示,根據銷售的商品型別顯示。如果我們想檢視另一個維度,例如地點維度,則三維檢視將很有用。下表顯示了根據時間、商品和地點進行銷售資料的 3D 檢視:
上面的三維表可以表示為如下圖所示的三維資料立方體:
資料 Mart
資料 Mart 包含組織範圍資料的一個子集,這些資料對組織中特定人群有價值。換句話說,資料 Mart 僅包含特定群體所需的資料。例如,營銷資料 Mart 可能僅包含與商品、客戶和銷售相關的資料。資料 Mart 限於主題。
關於資料 Mart 的要點
基於 Windows 或 Unix/Linux 的伺服器用於實現資料 Mart。它們在低成本伺服器上實現。
資料 Mart 的實現週期以較短的時間段(即以周而不是月或年)來衡量。
從長遠來看,如果資料 Mart 的計劃和設計不是組織範圍的,那麼其生命週期可能會很複雜。
資料 Mart 的規模較小。
資料 Mart 由部門定製。
資料 Mart 的來源是按部門結構化的資料倉庫。
資料 Mart 很靈活。
下圖顯示了資料 Mart 的圖形表示。
虛擬倉庫
對操作資料倉庫的檢視稱為虛擬倉庫。構建虛擬倉庫很容易。構建虛擬倉庫需要操作資料庫伺服器上的額外容量。