- 資料倉庫教程
- DWH - 首頁
- DWH - 概述
- DWH - 概念
- DWH - 術語
- DWH - 交付流程
- DWH - 系統流程
- DWH - 架構
- DWH - OLAP
- DWH - 關係型 OLAP
- DWH - 多維 OLAP
- DWH - 模式
- DWH - 分割槽策略
- DWH - 元資料概念
- DWH - 資料市集
- DWH - 系統管理員
- DWH - 流程管理員
- DWH - 安全性
- DWH - 備份
- DWH - 調優
- DWH - 測試
- DWH - 未來展望
- DWH - 面試問題
- DWH 有用資源
- DWH - 快速指南
- DWH - 有用資源
- DWH - 討論
資料倉庫 - 元資料概念
什麼是元資料?
元資料簡單來說就是關於資料的資料。用於表示其他資料的資料稱為元資料。例如,書籍的索引充當書籍內容的元資料。換句話說,我們可以說元資料是引導我們找到詳細資料的彙總資料。在資料倉庫方面,我們可以將元資料定義如下。
元資料是資料倉庫的路線圖。
資料倉庫中的元資料定義了倉庫物件。
元資料充當目錄。此目錄幫助決策支援系統定位資料倉庫的內容。
注意 - 在資料倉庫中,我們為給定資料倉庫的資料名稱和定義建立元資料。除了這些元資料之外,還會為任何提取的資料的時間戳、提取資料的來源建立附加元資料。
元資料的類別
元資料可以大致分為三類:
業務元資料 - 它包含資料所有權資訊、業務定義和更改策略。
技術元資料 - 它包括資料庫系統名稱、表和列名稱和大小、資料型別和允許的值。技術元資料還包括結構資訊,例如主鍵和外部索引鍵屬性以及索引。
操作元資料 - 它包括資料的有效性和資料血統。資料的有效性是指資料是活動狀態、已存檔還是已清除。資料血統是指資料遷移的歷史記錄以及對其應用的轉換。
元資料的角色
元資料在資料倉庫中扮演著非常重要的角色。元資料在倉庫中的作用與倉庫資料不同,但它扮演著重要的角色。下面解釋了元資料的各種角色。
元資料充當目錄。
此目錄幫助決策支援系統定位資料倉庫的內容。
當資料從操作環境轉換為資料倉庫環境時,元資料幫助決策支援系統進行資料對映。
元資料有助於在當前詳細資料和高度彙總資料之間進行彙總。
元資料還有助於在輕度詳細資料和高度彙總資料之間進行彙總。
元資料用於查詢工具。
元資料用於提取和清洗工具。
元資料用於報表工具。
元資料用於轉換工具。
元資料在載入功能中起著重要作用。
下圖顯示了元資料的角色。
元資料倉庫
元資料倉庫是資料倉庫系統的一個組成部分。它包含以下元資料:
資料倉庫的定義 - 它包括資料倉庫結構的描述。該描述由模式、檢視、層次結構、派生資料定義以及資料市集位置和內容定義。
業務元資料 - 它包含資料所有權資訊、業務定義和更改策略。
操作元資料 - 它包括資料的有效性和資料血統。資料的有效性是指資料是活動狀態、已存檔還是已清除。資料血統是指資料遷移的歷史記錄以及對其應用的轉換。
從操作環境到資料倉庫的對映資料 - 它包括源資料庫及其內容、資料提取、資料分割槽清理、轉換規則、資料重新整理和清除規則。
彙總演算法 - 它包括維度演算法、粒度資料、聚合、彙總等。
元資料管理的挑戰
元資料的重要性怎麼強調都不為過。元資料有助於提高報告的準確性,驗證資料轉換,並確保計算的準確性。元資料還將業務術語的定義強制執行給業務終端使用者。 儘管元資料有如此多的用途,但也面臨著挑戰。下面討論其中一些挑戰。
大型組織中的元資料分散在整個組織中。這些元資料分散在電子表格、資料庫和應用程式中。
元資料可能存在於文字檔案或多媒體檔案中。要將這些資料用於資訊管理解決方案,必須對其進行正確定義。
沒有業界普遍接受的標準。資料管理解決方案供應商關注面狹窄。
沒有簡單易行且被普遍接受的元資料傳遞方法。