什麼是資料倉庫調優?


資料倉庫是一種能夠收集和處理來自多個來源的資料的方法,為企業提供有意義的業務洞察。資料倉庫專門設計用於支援管理決策。

簡單來說,資料倉庫定義了一個獨立於組織運營資料庫維護的資料庫。資料倉庫系統能夠整合多個應用程式系統。它們透過提供可靠的整合歷史資訊平臺進行分析來提供資料處理。

資料倉庫將資料在多維空間中進行泛化和集中。資料倉庫的構建包含資料清洗、資料整合和資料轉換,可以看作是資料探勘的重要預處理步驟。

它提供聯機分析處理 (OLAP) 工具,用於互動式分析不同粒度的多維資料,這有助於有效的資料泛化和資料探勘。包括關聯、分類、預測和聚類在內的多種資料探勘功能可以與 OLAP 操作整合,從而在不同抽象級別構建互動式知識挖掘。

OLAP 是一種廣泛的術語,也涵蓋了資料倉庫。在這個模型中,資料以允許有效建立資料探勘/文件的格式儲存。OLAP 設計應適應對大型記錄集進行文件記錄,同時儘量減少運營效率的下降。

可以定義將 OLTP 結構中的資料結構轉換為 OLAP 結構中的相同資料的完整術語是“維度建模”,它是資料倉庫的基本構建塊。

可以對資料倉庫進行調優以提高效能。資料倉庫是進入系統的入口點,它提供了改進效能的第一個機會。如果在資料載入之前或之後對資料倉庫系統進行檢查,則它將直接影響系統的容量和效能。

例如,如果資料是電話呼叫記錄,則可以檢查每個呼叫是否具有有效的客戶識別符號。如果資料是銷售資訊,則可以檢查所售商品是否具有有效的產品識別符號。

載入大量資料或執行繁重的 I/O 操作,當需要對每個記錄應用大量檢查和轉換時,可能會佔用大量 CPU 資源。可以使用直接載入技術來提高載入速度。也可以使用並行處理來提高速度。

以下步驟提供了調優資料倉庫的最佳方法:

  • 調整業務規則。
  • 調整資料設計。
  • 調整應用程式設計。
  • 調整資料庫的邏輯結構。
  • 調整資料庫操作。
  • 調整訪問路徑。
  • 調整 I/O 和物理結構。
  • 調整資源爭用。
  • 調整底層模式。

更新於:2022年2月15日

1K+ 次瀏覽

開啟您的職業生涯

透過完成課程獲得認證

開始學習
廣告