資料倉庫 - 模式



模式定義為資料庫的邏輯描述,其中事實表和維度表以邏輯方式連線。資料倉庫以星型、雪花型和事實星座型模式的形式維護。

星型模式

星型模式包含一個事實表和多個維度表。每個維度僅由一個維度表表示,並且它們沒有被規範化。維度表包含一組屬性。

特點

  • 在星型模式中,只有一個事實表和多個維度表。
  • 在星型模式中,每個維度都由一個維度表表示。
  • 在星型模式中,維度表沒有被規範化。
  • 每個維度表都與事實表中的一個鍵連線。

下圖顯示了公司關於四個維度(時間、專案、分支和位置)的銷售資料。

Star Schema

中心有一個事實表。它包含每個四個維度的鍵。事實表還包含屬性,即銷售額和銷售數量。

注意 - 每個維度只有一個維度表,每個表都包含一組屬性。例如,位置維度表包含屬性集{location_key, street, city, province_or_state, country}。此約束可能會導致資料冗餘。

例如 - “溫哥華”和“維多利亞”這兩個城市都在加拿大不列顛哥倫比亞省。此類城市的條目可能會導致屬性province_or_state和country的資料冗餘。

雪花模式

雪花模式中的一些維度表被規範化了。規範化將資料拆分為附加表,如下圖所示。

Snowflakes Schema

與星型模式不同,雪花模式中的維度表被規範化了。

例如 - 星型模式中的專案維度表被規範化並拆分為兩個維度表,即專案表和供應商表。現在,專案維度表包含屬性item_key、item_name、type、brand和supplier-key。

供應商鍵連結到供應商維度表。供應商維度表包含屬性supplier_key和supplier_type。

注意 - 由於雪花模式中的規範化,冗餘減少了,因此易於維護並節省儲存空間。

事實星座模式(星系模式)

事實星座有多個事實表。它也稱為星系模式。

下圖顯示了兩個事實表,即銷售和發貨 -

Galaxy Schema

銷售事實表與星型模式中的相同。發貨事實表有五個維度,即item_key、time_key、shipper_key、from_location、to_location。發貨事實表還包含兩個度量,即銷售額和銷售數量。也可以在事實表之間共享維度表。

例如 - 時間、專案和位置維度表在銷售和發貨事實表之間共享。

廣告
© . All rights reserved.