- 資料倉庫教程
- DWH - 首頁
- DWH - 概述
- DWH - 概念
- DWH - 術語
- DWH - 交付流程
- DWH - 系統流程
- DWH - 架構
- DWH - OLAP
- DWH - 關係型 OLAP
- DWH - 多維 OLAP
- DWH - 模式
- DWH - 分割槽策略
- DWH - 元資料概念
- DWH - 資料集市
- DWH - 系統管理員
- DWH - 流程管理員
- DWH - 安全
- DWH - 備份
- DWH - 調優
- DWH - 測試
- DWH - 未來展望
- DWH - 面試問題
- DWH 有用資源
- DWH - 快速指南
- DWH - 有用資源
- DWH - 討論
資料倉庫 - 備份
資料倉庫是一個複雜的系統,包含大量的資料。因此,備份所有資料非常重要,以便在將來根據需要恢復資料。在本章中,我們將討論設計備份策略中的問題。
備份術語
在繼續之前,您應該瞭解以下討論的一些備份術語。
完整備份 - 它同時備份整個資料庫。此備份包括所有資料庫檔案、控制檔案和日誌檔案。
部分備份 - 顧名思義,它不會建立資料庫的完整備份。部分備份在大型資料庫中非常有用,因為它們允許採用一種策略,即每天以迴圈方式備份資料庫的各個部分,以便每週有效地備份整個資料庫。
冷備份 - 冷備份是在資料庫完全關閉時進行的。在多例項環境中,所有例項都應關閉。
熱備份 - 熱備份是在資料庫引擎執行時進行的。熱備份的要求因 RDBMS 而異。
線上備份 - 它與熱備份非常相似。
硬體備份
確定使用哪種硬體進行備份非常重要。處理備份和恢復的速度取決於所使用的硬體、硬體的連線方式、網路頻寬、備份軟體以及伺服器 I/O 系統的速度。在這裡,我們將討論一些可用的硬體選擇及其優缺點。這些選擇如下:
- 磁帶技術
- 磁碟備份
磁帶技術
磁帶選擇可分為以下幾類:
- 磁帶介質
- 獨立磁帶驅動器
- 磁帶庫
- 磁帶機櫃
磁帶介質
存在多種磁帶介質。下表列出了一些磁帶介質標準:
| 磁帶介質 | 容量 | I/O 速率 |
|---|---|---|
| DLT | 40 GB | 3 MB/s |
| 3490e | 1.6 GB | 3 MB/s |
| 8 mm | 14 GB | 1 MB/s |
需要考慮的其他因素如下:
- 磁帶介質的可靠性
- 每單位磁帶介質的成本
- 可擴充套件性
- 磁帶系統升級成本
- 每單位磁帶介質的成本
- 磁帶介質的儲存期限
獨立磁帶驅動器
磁帶驅動器可以透過以下方式連線:
- 直接連線到伺服器
- 作為網路可用裝置
- 遠端連線到其他機器
將磁帶驅動器連線到資料倉庫可能會遇到一些問題。
假設伺服器是 48 節點的 MPP 機器。我們不知道要將磁帶驅動器連線到哪個節點,也不知道如何在伺服器節點上分配它們以獲得最佳效能,同時最大程度地減少伺服器中斷和內部 I/O 延遲。
將磁帶驅動器連線為網路可用裝置需要網路能夠處理巨大的資料傳輸速率。確保在您需要時有足夠的頻寬可用。
遠端連線磁帶驅動器也需要高頻寬。
磁帶庫
將多個磁帶載入到單個磁帶驅動器中的方法稱為磁帶庫。當庫完成當前磁帶的操作時,它會卸下當前磁帶並載入下一盤磁帶,因此一次只能訪問一盤磁帶。價格和功能可能會有所不同,但它們通常都能夠執行無人值守備份。
磁帶機櫃
磁帶機櫃提供大型儲存容量。磁帶機櫃可以儲存和管理數千盤磁帶。它們可以整合多個磁帶驅動器。它們具有用於標記和儲存所儲存磁帶的軟體和硬體。機櫃通常透過網路或專用鏈路遠端連線。我們應該確保連線的頻寬能夠勝任工作。
磁碟備份
磁碟備份的方法包括:
- 磁碟到磁碟備份
- 映象斷開
這些方法用於 OLTP 系統。這些方法最大程度地減少資料庫停機時間並最大程度地提高可用性。
磁碟到磁碟備份
在此,備份儲存在磁碟上,而不是磁帶上。磁碟到磁碟備份出於以下原因而進行:
- 初始備份速度
- 恢復速度
將資料從磁碟備份到磁碟比備份到磁帶快得多。但是,它是備份的中間步驟。稍後將資料備份到磁帶上。磁碟到磁碟備份的另一個優點是它為您提供了最新備份的線上副本。
映象斷開
其想法是在工作日期間將磁碟映象以提高彈性。當需要備份時,可以斷開其中一個映象集。此技術是磁碟到磁碟備份的一種變體。
注意 - 可能需要關閉資料庫以保證備份的一致性。
光碟庫
光碟庫允許將資料儲存在近線儲存中。此技術允許以與磁帶庫或磁帶機櫃相同的方式管理大量光碟。此技術的缺點是其寫入速度比磁碟慢。但光學介質提供了長壽命和可靠性,使其成為歸檔的良好介質選擇。
軟體備份
有一些軟體工具可以幫助備份過程。這些軟體工具作為軟體包提供。這些工具不僅可以進行備份,還可以有效地管理和控制備份策略。市場上有許多軟體包可用。其中一些列在下表中:
| 軟體包名稱 | 供應商 |
|---|---|
| Networker | Legato |
| ADSM | IBM |
| Epoch | Epoch Systems |
| Omniback II | HP |
| Alexandria | Sequent |
選擇軟體包的標準
選擇最佳軟體包的標準列在下面:
- 隨著磁帶驅動器的增加,產品的可擴充套件性如何?
- 該軟體包是否具有客戶端-伺服器選項,或者它必須在資料庫伺服器本身上執行?
- 它是否適用於叢集和 MPP 環境?
- 需要多少程度的並行性?
- 該軟體包支援哪些平臺?
- 該軟體包是否支援輕鬆訪問有關磁帶內容的資訊?
- 該軟體包是否瞭解資料庫?
- 該軟體包支援哪些磁帶驅動器和磁帶介質?