資料倉庫資料建模
資料建模是指在資料倉庫平臺內處理和設計資料模型的過程。它包括建立合適的資料庫模式,以便傳輸可以儲存並對使用者有用的資料。資料倉庫建模有兩個原因:首先,可以透過模式視覺化倉庫資料之間的關係;其次,精心設計的模式可以降低成本並提高效率,從而實現有效的資料倉庫結構。資料倉庫中的資料建模與操作型資料庫系統中的資料建模不同,因此它可以有效地處理複雜的查詢。
資料建模生命週期
在這個生命週期中,我們將逐步瞭解如何將業務需求轉化為在IT系統中處理資料的目標。其目的是為業務建立一個儲存區域,為此,邏輯和物理資料建模都很有幫助。資料建模生命週期中使用的三個步驟如下:
概念資料模型
概念資料模型指的是對關係的有組織的檢視,即在實體之間找到最高級別的關係。其目的是建立實體及其之間的關係。
概念資料模型的特點:
僅顯示資料,例如實體及其關係。
實際資料庫中幾乎沒有其他資料。
未指定屬性和主鍵。
它主要用於面向業務的受眾。
邏輯資料模型
它以結構化的形式顯示資訊,而無需瞭解其物理外觀。其主要目的是使用業務資料結構、流程和關係來建立一個單一檢視。
邏輯資料模型的特點:
每個實體都具有屬性。
實體與關係一起存在。
存在主鍵和非主鍵屬性。
屬性名稱對使用者友好。
比概念資料模型更詳細。
存在主鍵和外部索引鍵關係。
外部索引鍵關係(指定引用完整性)。
物理資料模型
它指的是資料庫結構的視覺化,即複製表結構、列、資料型別、鍵、約束和表之間的關係後,模型在資料庫中的外觀。其主要目的是將邏輯資料模型顯示在資料倉庫託管的關係資料庫系統的物理結構中。它還可以使用新的資料結構來提高查詢效能。
物理資料模型的特徵:
實體和屬性分別稱為表和列。
列的資料型別、長度和值必須精確。
主鍵和外部索引鍵用於定義表之間的關係。
所有表和列的規範。
結論
本文介紹了資料倉庫中的資料建模,用於在資料倉庫中處理和設計資料模型。模式用於視覺化關係並提高效率,從而降低成本。資料建模生命週期包括三個部分:第一部分是概念資料模型,它指的是對關係的有組織的檢視;第二部分是邏輯資料模型,它建立單個檢視和結構資訊,而無需其物理外觀;第三部分是物理資料模型,它將邏輯資料模型視覺化為物理資料模型,從而提高查詢效能。