如何設計個體事實表?


設計個體事實表的方法如下:

選擇資料倉儲 - 最簡單的方法是選擇資訊來源。典型的資料倉儲包括採購訂單、發貨單、零售銷售、付款或使用者連線。這些可以是單一來源資料倉儲的例項。

在某些情況下,可以定義一個包含多個遺留來源的資料倉儲。多來源資料倉儲的一個例項是使用者盈利能力,其中定義收入的遺留來源應與表示成本的遺留來源相結合。

資料倉庫設計人員應透過首先僅執行單一來源資料倉儲來限制風險,以減少冗長的提取系統開發功能的數量。它還可以規定僅在一致維度組的上下文中實現這些獨立的資料倉儲,因此資料倉儲可以插入到資料倉庫匯流排中。

宣告事實表粒度 - 在建議的維度設計中,必須非常清楚地表示事實表資料是什麼。如果沒有清晰的描述,設計就無法繼續進行,資料架構師會浪費寶貴的時間來爭論什麼是維度,什麼是事實。

事實表粒度最好儘可能低,或儘可能細緻。選擇低級別粒度有很多好處,包括單一交易、單日快照或單一文件專案。

粒度越低,設計就越強大。可以認為低粒度方法在響應意外的新查詢和響應更多新資料元素的建立方面,遠優於高粒度方法。

選擇維度 - 由於事實表的粒度已經確定,維度的選擇相對簡單。粒度通常會決定一組主要的或標記的維度。例如,訂單上行專案的標記維度集必須包含訂單日期、使用者、產品以及僅包含訂單號的適當退化維度。

在維度模型中,事實表是在特定粒度下同時測量的一組值。一般的測量值是數值型的,但它們不必是數值型的。

選擇事實 - 事實表的粒度也使單個事實的選擇成為可能,並闡明瞭這些事實的範圍。

更新於:2022年2月9日

421 次瀏覽

開啟你的職業生涯

完成課程獲得認證

開始
廣告
© . All rights reserved.