資料倉庫質量的各種工具是什麼?


資料倉庫質量管理的各種工具如下:

質量定義

質量的定義和量化被給出,作為效能與期望值的比率。它用於將質量定義為產品交付給社會後所造成的損失。社會的全部損失可以被認為是生產者損失和使用者損失的總和。

眾所周知,產品或服務的質量與生產成本之間存在權衡關係,並且組織應該在這兩個引數之間找到平衡。如果平衡被打破,那麼組織無論如何都會失敗。

資料質量研究

在資料質量領域已經完成了多項研究。研究人員和實踐者都面臨著提高決策支援系統質量的問題,通常是透過改善其資訊質量來實現的。它可以展示該領域的相關工作,這些工作或多或少地影響了我們資料倉庫質量的方法。

該框架包括七個從 ISO 9000 標準中採用的要素,例如行政責任、服務和保證成本、研究與開發、生產、分銷、人事管理和法律服務。該框架回顧了資料質量文獻的重要部分,但只有資料質量的研究與開發形式似乎與資料倉庫質量設計的原因相一致。

該領域包含三個主要問題:資料產品的分析和設計資料質量方法、結合資料質量方法的設計資料製造系統 (DMS) 以及資料質量度量的定義。

資料質量系統圍繞組織結構、責任、流程和實現資料質量管理的資源。資料質量控制是一組用於獲得資料產品所需質量的操作方法和活動。資料質量保證包含所有必要的準備和有序服務,以支援充分的信心,即資料產品將滿足給定的一組質量規範。

資料質量

儲存在倉庫中的資料的質量本身並不是一個過程。它受到倉庫環境中發生的所有過程的影響。以下是一些資料質量因素:

  • **完整性**因素定義了源和倉庫中引入的感興趣的真實世界資料的百分比。

  • **可信度**因素定義了支援資料的源的可信度。

  • **準確性**因素定義了出現在源中的資料輸入過程的準確性。

  • **一致性**因素定義了資料相對於邏輯規則和約束的邏輯連貫性。

  • **資料可解釋性**因素與資料定義有關(即遺留系統和外部記錄的資料設計、關係資料庫的表定義、主鍵和外部索引鍵、別名、預設值、域、編碼值的描述等)。

更新時間: 2021年11月23日

224 次檢視

啟動你的 職業生涯

透過完成課程獲得認證

開始學習
廣告