資料倉庫 - 概念



什麼是資料倉庫?

資料倉庫是構建和使用資料倉庫的過程。資料倉庫透過整合來自多個異構資料來源的資料來構建,這些資料來源支援分析報告、結構化和/或臨時查詢以及決策制定。資料倉庫涉及資料清洗、資料整合和資料整合。

使用資料倉庫資訊

有一些決策支援技術可以幫助利用資料倉庫中可用的資料。這些技術幫助高管快速有效地使用倉庫。他們可以收集資料、分析資料,並根據倉庫中的資訊做出決策。倉庫中收集的資訊可用於以下任何領域:

  • 調整生產策略 - 透過比較季度或年度銷售額,可以重新定位產品並管理產品組合來很好地調整產品策略。

  • 客戶分析 - 透過分析客戶的購買偏好、購買時間、預算週期等來進行客戶分析。

  • 運營分析 - 資料倉庫還有助於客戶關係管理和進行環境修正。這些資訊還允許我們分析業務運營。

整合異構資料庫

為了整合異構資料庫,我們有兩種方法:

  • 查詢驅動方法
  • 更新驅動方法

查詢驅動方法

這是整合異構資料庫的傳統方法。這種方法用於在多個異構資料庫之上構建包裝器和整合器。這些整合器也稱為中介。

查詢驅動方法的過程

  • 當向客戶端發出查詢時,元資料字典會將查詢轉換為參與的各個異構站點適用的形式。

  • 現在這些查詢被對映併發送到本地查詢處理器。

  • 來自異構站點的結果被整合到全域性答案集中。

缺點

  • 查詢驅動方法需要複雜的整合和過濾過程。

  • 這種方法非常低效。

  • 對於頻繁的查詢,它非常昂貴。

  • 對於需要聚合的查詢,這種方法也非常昂貴。

更新驅動方法

這是對傳統方法的替代方法。當今的資料倉庫系統遵循更新驅動方法,而不是前面討論的傳統方法。在更新驅動方法中,來自多個異構源的資訊會預先整合並存儲在倉庫中。此資訊可用於直接查詢和分析。

優點

這種方法具有以下優點:

  • 這種方法提供高效能。

  • 資料預先在語義資料儲存中被複制、處理、整合、註釋、彙總和重構。

  • 查詢處理不需要介面來處理本地源的資料。

資料倉庫工具和實用程式的功能

以下是資料倉庫工具和實用程式的功能:

  • 資料提取 - 涉及從多個異構源收集資料。

  • 資料清洗 - 涉及查詢和糾正資料中的錯誤。

  • 資料轉換 - 涉及將資料從舊格式轉換為倉庫格式。

  • 資料載入 - 涉及排序、彙總、整合、檢查完整性以及構建索引和分割槽。

  • 重新整理 - 涉及從資料來源更新到倉庫。

注意 - 資料清洗和資料轉換是提高資料質量和資料探勘結果的重要步驟。

廣告
© . All rights reserved.