什麼是資料倉庫調優?
資料倉庫是一種能夠收集和處理來自多個來源的資料的方法,為企業提供有意義的業務洞察。資料倉庫專門設計用於支援管理決策。
簡單來說,資料倉庫定義了一個獨立於組織運營資料庫維護的資料庫。資料倉庫系統能夠整合多個應用程式系統。它們透過提供可靠的整合歷史資訊平臺進行分析來提供資料處理。
資料倉庫將資料在多維空間中進行泛化和集中。資料倉庫的構建包含資料清洗、資料整合和資料轉換,可以看作是資料探勘的重要預處理步驟。
它提供聯機分析處理 (OLAP) 工具,用於互動式分析不同粒度的多維資料,這有助於有效的資料泛化和資料探勘。包括關聯、分類、預測和聚類在內的多種資料探勘功能可以與 OLAP 操作整合,從而在不同抽象級別構建互動式知識挖掘。
OLAP 是一種廣泛的術語,也涵蓋了資料倉庫。在這個模型中,資料以允許有效建立資料探勘/文件的格式儲存。OLAP 設計應適應對大型記錄集進行文件記錄,同時儘量減少運營效率的下降。
可以定義將 OLTP 結構中的資料結構轉換為 OLAP 結構中的相同資料的完整術語是“維度建模”,它是資料倉庫的基本構建塊。
可以對資料倉庫進行調優以提高效能。資料倉庫是進入系統的入口點,它提供了改進效能的第一個機會。如果在資料載入之前或之後對資料倉庫系統進行檢查,則它將直接影響系統的容量和效能。
例如,如果資料是電話呼叫記錄,則可以檢查每個呼叫是否具有有效的客戶識別符號。如果資料是銷售資訊,則可以檢查所售商品是否具有有效的產品識別符號。
載入大量資料或執行繁重的 I/O 操作,當需要對每個記錄應用大量檢查和轉換時,可能會佔用大量 CPU 資源。可以使用直接載入技術來提高載入速度。也可以使用並行處理來提高速度。
以下步驟提供了調優資料倉庫的最佳方法:
- 調整業務規則。
- 調整資料設計。
- 調整應用程式設計。
- 調整資料庫的邏輯結構。
- 調整資料庫操作。
- 調整訪問路徑。
- 調整 I/O 和物理結構。
- 調整資源爭用。
- 調整底層模式。
廣告