選擇資料來源的標準是什麼?
選擇資料來源的標準有很多,如下所示:
資料可訪問性 - 如果存在兩種可能的資料來源,一種儲存在專案團隊中最年輕成員出生前就編寫的一組程式維護的二進位制檔案中,另一種來自讀取二進位制文件並支援更多處理的系統,那麼決策就很明顯了。
資料準確性 - 當資料從一個系統傳遞到另一個系統時,會進行許多修改。有時會新增來自其他系統的資料元素,有時會處理現有元素以建立新元素,而其他元素則被刪除。
每個系統都能很好地執行其功能。但是,識別原始資料可能會變得困難或不可能。在某些情況下,資料不再代表業務分析所需的內容。如果您提供來自這些下游系統的資料,使用者可能會質疑其準確性。
專案進度安排 - 在許多組織中,資料倉庫專案作為現有 OLTP 系統重寫的部分內容開始。隨著新的系統開發專案開始展開,那些確信資料倉庫價值的業務使用者開始堅持要求儘早實施資料倉庫。
為了提供歷史資料,您需要將現有系統中的資料包含在資料倉庫中。如果舊系統的重寫被擱置,資料倉庫可以繼續利用當前系統。一旦新系統釋出到生產環境,資料饋送就可以切換到它。在許多情況下,可以在完成新作業系統之前交付資料倉庫。
一些維度資訊通常與事務或事實資料一起出現,但通常很少,而且通常僅以程式碼的形式出現。使用者可能需要和需要的附加屬性是從多個系統或聯合主檔案中獲取的。
在許多情況下,可能存在多個主檔案,特別是對於客戶維度而言。通常存在跨組織使用的單獨檔案。銷售、市場營銷和財務部門可能有他們自己的客戶主檔案。
有兩個難題:首先,這些檔案中包含的客戶可能不同,並且每個客戶的屬性也可能不同。其次,公共資訊可能不匹配。如果可以擁有無限的時間和金錢,則可以從所有來源提取豐富的資料,然後將其組合成客戶的單個綜合檢視。
在大多數情況下,沒有足夠的時間或金錢來一次性完成所有這些工作。在這些情況下,建議使用者優先考慮資訊,從您可以開始的地方開始,並在將來擴充套件。