• SAP HANA Video Tutorials

SAP HANA - 資料倉庫中的模式



模式是對資料倉庫中表的邏輯描述。模式透過連線多個事實表和維度表來滿足某些業務邏輯而建立。

資料庫使用關係模型來儲存資料。但是,資料倉庫使用連線維度表和事實表以滿足業務邏輯的模式。資料倉庫中使用了三種類型的模式:

  • 星型模式
  • 雪花模式
  • 星系模式

星型模式

在星型模式中,每個維度都連線到一個事實表。每個維度僅由一個維度表示,並且不會進一步規範化。

維度表包含用於分析資料的屬性集。

示例 - 在下面給出的示例中,我們有一個事實表 FactSales,它具有所有 Dim 表的主鍵以及度量單位_sold 和美元_sold 用於進行分析。

我們有四個維度表:DimTime、DimItem、DimBranch、DimLocation

Star Schema

每個維度表都連線到事實表,因為事實表具有每個維度表的主鍵,該主鍵用於連線兩個表。

事實表中的事實/度量與維度表中的屬性一起用於分析目的。

雪花模式

在雪花模式中,一些維度表被進一步規範化,並且 Dim 表連線到單個事實表。規範化用於組織資料庫的屬性和表,以最大程度地減少資料冗餘。

規範化涉及將一個表分解成更少的冗餘的小表,而不會丟失任何資訊,並且較小的表連線到維度表。

Snowflakes Schema

在上面的示例中,DimItem 和 DimLocation 維度表被規範化,而不會丟失任何資訊。這稱為雪花模式,其中維度表進一步規範化為較小的表。

星系模式

在星系模式中,存在多個事實表和維度表。每個事實表儲存一些維度表的主鍵以及度量/事實以進行分析。

Galaxy Schema

在上面的示例中,有兩個事實表 FactSales、FactShipping 和多個連線到事實表的維度表。每個事實表都包含連線的 Dim 表的主鍵以及度量/事實以執行分析。

廣告