資料倉庫設計的流程是什麼?
資料倉庫可以使用三種方法構建:
自頂向下方法
自底向上方法
兩種方法的結合
自頂向下方法從完整的規劃和設計開始。當技術成熟且易於掌握,並且需要解決的業務問題清晰易懂時,這種方法非常有用。
自底向上方法從實驗和原型開始。這在業務建模和技術發展的初期階段非常有利。它使組織能夠以較低的成本向前發展,並在做出重大承諾之前計算技術的優勢。
在組合方法中,組織可以利用自頂向下方法的計劃性和戰略性特點,同時保留自底向上方法的快速執行和機會性軟體。
一般來說,倉庫設計流程包括以下步驟:
可以選擇一個要建模的業務流程,例如訂單、發票、發貨、庫存、賬戶管理、銷售和總賬。如果業務流程是組織性的,涉及多個複雜的業務物件集合,則應遵循資料倉庫模型。但是,如果流程是部門性的,並且側重於分析一種型別的業務流程,則必須選擇資料市場模型。
可以選擇業務流程的粒度。粒度是此流程的事實表中要表示的資料的基本原子級別,例如單個交易、單個每日快照等。
可以選擇適用於每個事實表記錄的維度。典型的維度包括時間、專案、客戶、供應商、倉庫、交易型別和狀態。
可以選擇填充每個事實表記錄的度量。典型的度量是可加的數值量,例如銷售額和銷售單位。
由於資料倉庫的設計和構建,倉庫的最初部署包括初始安裝、推廣計劃、培訓和指導。還應處理平臺更新和維護。
資料倉庫管理將包括資料重新整理、資料來源同步、災難恢復計劃、訪問控制和安全管理、資料增長管理、資料庫效能管理以及資料倉庫的增強和擴充套件。
範圍管理包括控制查詢、維度和文件的數量和範圍;限制資料倉庫的大小;或限制時間表、預算或資源。
有各種各樣的資料倉庫設計工具可用。資料倉庫開發工具支援定義和編輯元資料儲存庫內容(包括模式、指令碼或規則)、回答查詢、輸出報表以及在關係資料庫系統目錄之間傳輸元資料的功能。
**規劃和分析工具**研究更改重新整理率或時間視窗時模式更改和重新整理效能的影響。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP