資料倉庫的多層架構
在本文中,我們將討論資料倉庫的多層架構。
簡介
資料倉庫就像一個大型儲存庫,用於儲存資訊,以便人們可以利用這些資訊做出更明智的決策。這些資訊來自不同的來源,例如資料庫和其他跟蹤交易的系統。資訊會定期新增到倉庫中。倉庫是一箇中心位置,所有這些資料都在這裡進行組織並易於分析。它整合了來自不同來源的資料。它將其轉換為可訪問和分析的格式。為了確保資料倉庫的有效運作,它必須具有多層架構。
多層架構的必要性
資料倉庫是一個複雜的系統。它需要多層來處理大量資料。需要一個多級結構。系統的每一層都高效地執行其特定功能。多層架構提供了許多好處。這些包括:更好的資料質量、更快的查詢響應時間、更好的資料整合和可擴充套件性。
多層架構
多層架構中有四層。它們是:資料來源層、ETL 層、資料儲存層和資料訪問層。下面將簡要解釋這些層。
資料來源層
它是多層架構的第一層。它包含需要整合到資料倉庫中的所有資料來源。這些來源可以是資料庫、平面檔案或外部來源,例如社交媒體平臺。資料來源層負責在將資料傳遞到下一層之前收集、驗證和組織資料。
ETL 層
這是多層架構的第二層。它負責從資料來源提取資料。它將資料轉換為適合資料倉庫的格式。它還將其載入到資料儲存層。此層確保載入到資料倉庫中的資料的質量和一致性。
資料儲存層
這是多層架構的第三層。它負責儲存 ETL 層轉換和載入的資料。此層可以分為兩個子層:暫存區和資料倉庫。暫存區用於在將資料載入到資料倉庫之前臨時儲存資料。資料倉庫是資料的最終目的地,用於報告和分析。
資料訪問層
它是多層架構的第四層。它負責向用戶提供對資料的訪問許可權。此層可以分為兩個子層 -
表示層為使用者提供了一個使用者友好的介面來訪問和分析資料。
應用層負責管理業務邏輯並確保資料的安全性和完整性。
多層資料倉庫架構元件
多層資料倉庫架構具有以下元件:資料來源、資料整合層、暫存區、資料倉庫資料庫、資料市集、OLAP 多維資料集、前端工具、元資料儲存庫。

多層資料倉庫架構可以分為三個主要部分。它們是:底層、中間層和頂層。下面將簡要解釋這些層。
底層(資料來源和資料儲存)
此層包含資料來源和資料儲存。它通常使用倉庫資料庫伺服器(例如 RDBMS)實現。閘道器(例如 ODBC、OLE-DB 和 JDBC)用於從運營和外部源提取資料。
中間層
此層是 OLAP 伺服器。OLAP 伺服器可以使用關係型 OLAP (ROLAP) 模型或多維 OLAP (MOLAP) 模型實現。ROLAP 是擴充套件的關係型資料庫管理系統。它將操作從標準資料對映到標準資料。而 MOLAP 是一種專用伺服器,直接實現多維資料和操作。
頂層
此層是前端客戶端層。它具有查詢和報告工具、分析工具和資料探勘工具,例如趨勢分析和預測。
資料倉庫模型
從架構角度來看,有三種類型的資料倉庫模型 -
企業級倉庫
它收集來自組織所有部分的資料並將其整合起來,以提供組織的完整檢視。
它可能非常龐大且複雜,需要大量的建模和設計才能實施。
資料市集
它包含來自企業級倉庫的特定於特定使用者組的資料子集。
它比企業級倉庫更小且更容易實施,通常用於部門級報告和分析。
虛擬倉庫
它是一組位於運營資料庫之上的檢視,而不是一個單獨的資料庫。
它易於建立,但需要在運營資料庫伺服器上增加容量才能支援高效的查詢。
多層架構的優點
以下是資料倉庫多層架構的主要優點 -
可擴充套件性
可以根據資料倉庫的需要新增、刪除或更新元件。
更好的效能
多層可以實現並行和高效的處理,從而提高效能和反應時間。
模組化
模組化設計允許建立、測試和部署單獨的元件。
安全性
對各個層應用安全措施可以增強資料倉庫的整體安全性。
改進的資源管理
不同的層可以調整為使用適當的硬體資源,從而降低成本並提高效率。
更易於維護
可以更新或維護各個元件,而不會影響整個資料倉庫。
提高可靠性
多層架構提供冗餘和故障轉移功能,從而增強資料倉庫的整體可靠性。