在資料架構中,現代資料倉庫 (MDW) 是一箇中心儲存庫,組織可以在其中儲存和分析所有資料。它結合了關係型資料倉庫 (RDW) 的組織結構和資料湖的靈活性。這意味著企業可以訪問即時資料,發現趨勢,並改進與客戶的連線方式。
透過最大限度地利用其資料,現代資料倉庫幫助組織保持創新和競爭力。本章將探討 MDW 的架構、工作原理以及實施步驟。
現代資料倉庫 (MDW) 的架構結合了關係型資料倉庫 (RDW) 和資料湖的功能。這種設計允許靈活的資料處理和強大的分析能力。
現代資料倉庫 (MDW) 的結構結合了關係型資料倉庫 (RDW) 的有序佈局和資料湖的靈活性。這種設定使組織更容易有效地儲存和分析其資料。
現代資料倉庫 (MDW) 的結構旨在處理不同型別的資料和分析流程。它包括:
現代資料倉庫 (MDW) 中的資料流階段解釋瞭如何收集、儲存、處理和分析資料。此過程將原始資料轉化為對企業有用的見解。其工作原理如下:
在設定現代資料倉庫 (MDW) 時,組織應考慮以下幾個重要方面。
現代資料倉庫 (MDW) 越來越受歡迎,因為它們提供了一種靈活的資料管理方式。它們幫助組織將關係型資料倉庫 (RDW) 和資料湖的最佳功能結合在一起,從而更輕鬆地處理和組合資料。
現代資料倉庫 (MDW) 提供了許多優勢,可幫助組織管理和分析其資料。以下是它們如何真正使企業受益。
雖然現代資料倉庫具有許多優點,但也有一些缺點需要注意。瞭解這些限制對於成功實施至關重要。
在現代資料倉庫 (MDW) 中,資料湖用於儲存和準備資料,而關係型資料倉庫 (RDW) 則確保資料安全並遵守規則。
資料湖是一個靈活的儲存空間,資料科學家和技術使用者可以輕鬆地處理大量原始資料。它幫助他們探索和清理資料。
關係型資料倉庫專為希望快速輕鬆地訪問結構化資料的業務使用者而設計,使其非常適合生成報表和儀表板。
建立現代資料倉庫 (MDW) 是一項艱鉅的任務,需要大量投資技術和資源。隨著組織開始這段旅程,他們通常需要臨時解決方案來滿足其當前的資料需求。這些解決方案是通向完整現代資料倉庫的階梯,幫助企業在有效利用資料的同時保持靈活性。
以下是三種常見的階梯式架構:
每個選項都有其自身的優點和缺點。它們幫助組織遷移到現代資料倉庫 (MDW) 的有效性取決於組織的需求、現有系統、預算和目標。讓我們仔細研究每一個選項。
企業資料倉庫 (EDW) 增強是一種方法,適用於已經擁有本地企業資料倉庫 (EDW) 並希望管理更大資料集(通常稱為“大資料”)的公司。這種方法幫助組織充分利用其資料,同時解決與儲存和處理能力相關的挑戰。
在此設定中,建立一個基於雲的資料湖來儲存大量資料。使用者可以從此資料湖執行查詢並建立報表,而主要資料保留在企業資料倉庫 (EDW) 中。這允許公司使用雲資源來管理大資料,而無需完全替換其現有系統。
以下是使用企業資料倉庫 (EDW) 增強的主要優勢。
雖然企業資料倉庫 (EDW) 增強具有許多優點,但也有一些挑戰是組織應該牢記的。
此設定可以幫助組織將其本地企業資料倉庫 (EDW) 緩慢遷移到雲端。一旦資料湖到位,公司就可以開始將資料從 EDW 傳輸到資料湖,並可能作為完整現代資料倉庫 (MDW) 的一部分傳輸到新的基於雲的關係型資料倉庫 (RDW)。
當公司需要處理大資料但沒有時間進行大規模更改時,可以使用臨時資料湖 + EDW 方法。此設定透過臨時使用資料湖來減輕 EDW 的壓力。
在此模型中,資料湖是一個臨時儲存空間,用於儲存和改進資料。所有查詢和報表都是透過企業資料倉庫 (EDW) 完成的,使其易於設定和處理,而不會造成重大問題。
臨時資料湖 + EDW 方法具有許多優勢,可幫助組織更有效地管理其資料。
臨時資料湖 + EDW 方法的主要挑戰之一是,組織可能無法充分利用資料湖的優勢,因為它只是臨時使用的。這種有限的使用可能會阻止他們訪問資料湖提供的所有功能和優勢,從而降低其改進資料管理的效率。
這種方法可以透過少量更改輕鬆過渡到完整的現代資料倉庫 (MDW),使其成為組織的實用階梯。
一體化架構深受眾多組織,特別是初創企業和小型企業的歡迎,因為它提供了一種簡便的資料管理方式。它允許快速原型設計,並專注於獲得即時結果。
在這種設定中,所有資料報告和查詢都直接在資料湖中完成,無需單獨的關係型資料倉庫 (RDW)。這使得整體資料結構更加簡單。
一體化方法具有若干重要優勢,使組織的資料管理更加輕鬆。
一體化方法也面臨一些挑戰,尤其是在效能方面。如果沒有關係型資料倉庫 (RDW),組織可能會在速度、安全性和使用者體驗方面遇到困難。雖然一些專注於資料科學的公司可能僅靠資料湖就能應付,但最終他們需要新增關係型資料倉庫 (RDW)才能充分受益於完整的現代資料倉庫 (MDW)。
對於某些組織,特別是那些專注於資料科學的組織,僅使用資料湖就足夠了。但是,要完全過渡到完整的現代資料倉庫 (MDW),他們最終需要新增一個關係型資料倉庫 (RDW)。
本章解釋了現代資料倉庫 (MDW)以及資料旅程中的五個步驟:攝取、儲存、轉換、建模和視覺化。我們討論了現代資料倉庫 (MDW)的優勢和挑戰,並探討了EDW增強和臨時資料湖等方法。