- 資料倉庫教程
- DWH - 首頁
- DWH - 概述
- DWH - 概念
- DWH - 術語
- DWH - 交付流程
- DWH - 系統流程
- DWH - 架構
- DWH - OLAP
- DWH - 關係型 OLAP
- DWH - 多維 OLAP
- DWH - 模式
- DWH - 分割槽策略
- DWH - 元資料概念
- DWH - 資料市場化
- DWH - 系統管理員
- DWH - 流程管理員
- DWH - 安全性
- DWH - 備份
- DWH - 調優
- DWH - 測試
- DWH - 未來展望
- DWH - 面試問題
- DWH 有用資源
- DWH - 快速指南
- DWH - 有用資源
- DWH - 討論
資料倉庫 - 概念
什麼是資料倉庫?
資料倉庫是構建和使用資料倉庫的過程。資料倉庫透過整合來自多個異構資料來源的資料來構建,這些資料來源支援分析報告、結構化和/或臨時查詢以及決策制定。資料倉庫涉及資料清洗、資料整合和資料整合。
使用資料倉庫資訊
有一些決策支援技術可以幫助利用資料倉庫中可用的資料。這些技術幫助高管快速有效地使用倉庫。他們可以收集資料、分析資料,並根據倉庫中的資訊做出決策。倉庫中收集的資訊可用於以下任何領域:
調整生產策略 - 透過比較季度或年度銷售額,可以重新定位產品並管理產品組合來很好地調整產品策略。
客戶分析 - 透過分析客戶的購買偏好、購買時間、預算週期等來進行客戶分析。
運營分析 - 資料倉庫還有助於客戶關係管理和進行環境修正。這些資訊還允許我們分析業務運營。
整合異構資料庫
為了整合異構資料庫,我們有兩種方法:
- 查詢驅動方法
- 更新驅動方法
查詢驅動方法
這是整合異構資料庫的傳統方法。這種方法用於在多個異構資料庫之上構建包裝器和整合器。這些整合器也稱為中介。
查詢驅動方法的過程
當向客戶端發出查詢時,元資料字典會將查詢轉換為參與的各個異構站點適用的形式。
現在這些查詢被對映併發送到本地查詢處理器。
來自異構站點的結果被整合到全域性答案集中。
缺點
查詢驅動方法需要複雜的整合和過濾過程。
這種方法非常低效。
對於頻繁的查詢,它非常昂貴。
對於需要聚合的查詢,這種方法也非常昂貴。
更新驅動方法
這是對傳統方法的替代方法。當今的資料倉庫系統遵循更新驅動方法,而不是前面討論的傳統方法。在更新驅動方法中,來自多個異構源的資訊會預先整合並存儲在倉庫中。此資訊可用於直接查詢和分析。
優點
這種方法具有以下優點:
這種方法提供高效能。
資料預先在語義資料儲存中被複制、處理、整合、註釋、彙總和重構。
查詢處理不需要介面來處理本地源的資料。
資料倉庫工具和實用程式的功能
以下是資料倉庫工具和實用程式的功能:
資料提取 - 涉及從多個異構源收集資料。
資料清洗 - 涉及查詢和糾正資料中的錯誤。
資料轉換 - 涉及將資料從舊格式轉換為倉庫格式。
資料載入 - 涉及排序、彙總、整合、檢查完整性以及構建索引和分割槽。
重新整理 - 涉及從資料來源更新到倉庫。
注意 - 資料清洗和資料轉換是提高資料質量和資料探勘結果的重要步驟。