什麼是資料暫存區?
在資料倉庫過程中,資料暫存區由資料暫存伺服器軟體和資料儲存歸檔(儲存庫)組成,其中儲存了提取、轉換和載入活動的成果。
資料暫存軟體伺服器臨時儲存和更改從 OLTP 資料來源提取的資料,而歸檔儲存庫則儲存已清理、轉換後的資料和屬性,以便載入到資料市場和資料倉庫中。
資料暫存過程將資訊匯入為流或檔案,對其進行更改,生成整合、清理後的資料,並將其暫存以載入到資料倉庫、資料市場或操作資料儲存中。
資料暫存工具是可訪問的,資料位於資料庫中。資料流開始,使其從源系統出現,透過轉換引擎更改,並進入暫存資料庫。
在第二種方法中,它可以從大型機遺留系統開始,然後將所需記錄提取到平面檔案中,將檔案更改為暫存伺服器,轉換其內容,並將轉換後的資訊載入到暫存資料庫中。
資料倉庫暫存區是一個臨時區域,用於複製來自源系統的資料。在資料倉庫體系結構中通常需要暫存區,原因是時間問題。簡而言之,在將資料統一到資料倉庫之前,應準備好所有必要的資訊。
由於業務週期、資料處理週期、硬體和網路資源限制以及地理因素的不同,無法在完全相同的時間從所有操作資料庫中提取所有資訊。
示例 - 提取每日銷售資料是合理的,但是,每日提取可能不適用於需要月度對賬程式的財務資訊。同樣,從新加坡的資料庫中在東部標準時間中午提取“客戶”資料可能是合適的,但這可能不適用於芝加哥資料庫中的“客戶”資料。
資料倉庫中的資料可以是永續性的(即保留很長時間)或瞬態的(即僅保留一段時間)。並非所有企業都需要資料倉庫暫存區。對於許多企業來說,使用 ETL 將資料直接從操作資料庫複製到資料倉庫是合適的。
資料暫存的優缺點
優點
暫存過程與轉換過程並行控制。
磁碟 I/O 減半,因為暫存表僅寫入一次,然後再次提取。
缺點
如果轉換過程失敗,則暫存過程也將停止。
廣告
資料結構
網路
RDBMS
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP