什麼是質量驅動的資料倉庫設計?
資料倉庫定義了一個獨立於組織運營資料庫維護的資料庫。資料倉庫系統能夠整合多個應用程式系統。它們透過支援可靠的整合歷史記錄平臺來支援資料處理,以進行分析。
資料倉庫可以被視為一組在遠端基礎關係上表示的物化檢視。當查詢正式時,它會在本地使用物化檢視進行計算,而無需訪問初始資料來源。
資料倉庫是一個隨著時間推移不斷發展的活動實體。隨著時間的推移,需要回答新的查詢。可以使用物化檢視專門回答各種查詢。通常,需要將新檢視插入到資料倉庫中。
在某些組織中,基本的聯機事務處理 (OLTP) 基礎設施到位後(並非最小的,透過包括 SAP/R3 在內的標準化企業資源規劃工具),感興趣的目標現在至少正在三個方向上擴充套件:
更廣泛的內部和外部多媒體資料來源。
更廣泛的客戶群體,具有不同的興趣和能力特徵以及情境引數。
將事務處理生成的龐大經驗資料轉換為適用於組織資訊和行動的知識。
正在提出各種各樣的資料流物流架構,包括供應鏈管理和企業對企業電子商務。在這些架構中,資料庫可以被視為資料的短期和中期中間儲存,而資料倉庫則用於長期儲存、知識建立和管理。
資料倉庫系統包括資料庫(源資料庫、資料倉庫中的物化檢視)、將記錄從一個數據庫傳送到另一個數據庫的資料傳輸代理以及儲存有關係統及其擴充套件的元資料的儲存庫。
在此架構中,首先透過稱為包裝器的提取機制建立適用於統一方法的異構資料來源,然後中介承擔資料整合和衝突解決的服務。包裝器和中介之間的分離是一個經過深思熟慮的設計決策,反映了包括 CORBA 在內的中介軟體系統中服務包裝器和請求代理之間的分離。
生成的標準化和整合記錄作為物化檢視儲存在資料倉庫中。這些基本檢視通常略微聚合。可以為多個分析師使用者定製它們,具有關於特定興趣領域更聚合資訊的資料市場被構建為二級快取,然後由從查詢工具到電子表格工具再到成熟的資料探勘系統的各種資料分析工具滲透。