為什麼我們需要單獨的資料倉庫?


資料倉庫是一種主要用於從各種來源收集和管理資料以向企業提供有意義的業務洞察力的技術。資料倉庫專門設計用於支援管理決策。

簡單來說,資料倉庫是指與組織的操作資料庫分開維護的資料庫。資料倉庫系統能夠整合多個應用程式系統。它們透過支援一個鞏固的歷史資訊的可靠平臺來進行資料處理,以便進行分析。

資料倉庫查詢很複雜,因為它們包含在彙總級別計算大量資訊。它可能需要使用獨特的資料組織、訪問和實現技術,具體取決於多維檢視。

這種分離的主要原因之一是幫助提高兩個系統的實施效率。操作資料庫是根據已知的功能和工作負載建立和調整的,包括使用主鍵進行索引和雜湊、搜尋特定記錄以及最佳化“預置”查詢。

另一方面,資料倉庫查詢通常很複雜。它們包括在彙總級別計算大量資訊,並且可能需要使用特定於多維檢視的資料組織、訪問和實現方法。在操作資料庫中處理 OLAP 查詢會大大降低操作任務的效能。

此外,操作資料庫提供了多個事務的併發處理。併發控制和恢復機制(包括鎖定和日誌記錄)是確保事務的一致性和魯棒性所必需的。OLAP 查詢通常需要對資料記錄進行只讀訪問以進行彙總和聚合。

如果將併發控制和恢復機制應用於此類 OLAP 操作,可能會危及併發事務的執行,從而大大降低 OLTP 系統的吞吐量。

最後,操作資料庫與資料倉庫的分離基於這兩個系統中資訊的多種結構、內容和用途。決策支援需要歷史資訊,而操作資料庫通常不維護歷史資訊。

決策支援需要整合,包括來自異構源的資訊聚合和彙總,從而產生高質量、乾淨和整合的資訊。相反,操作資料庫僅包含詳細的原始資料(包括事務),這些資料需要在分析之前進行整合。

由於這兩個系統提供完全不同的功能並需要不同型別的資料,因此目前有必要維護單獨的資料庫。但是,有各種操作關係資料庫管理系統供應商開始最佳化這些系統以支援 OLAP 查詢。隨著這種趨勢的持續,OLTP 和 OLAP 系統之間的界限預計會減少。

更新時間: 2021 年 11 月 22 日

5K+ 次檢視

開啟你的職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.