什麼是並行資料庫?並解釋其工作原理。
並行資料庫是指使用多個處理器並行工作於資料庫以提供服務的資料庫。
並行資料庫系統旨在透過並行化各種操作(如載入資料、構建索引和評估查詢)來提高效能。並行系統透過並行使用多個 CPU 和磁碟來提高處理和 I/O 速度。
並行資料庫的工作原理
讓我們逐步討論並行資料庫的工作原理:
步驟 1 - 並行處理將一個大型任務分解成許多較小的任務,並在多個 CPU 上併發執行這些較小的任務,從而更快地完成任務。
步驟 2 - 並行資料庫系統的驅動力是對能夠查詢數TB級超大型資料庫或每秒處理大量事務的應用程式的需求。
步驟 3 - 在並行處理中,許多操作是同時執行的,而序列處理中計算步驟是順序執行的。
下圖解釋了並行資料庫的工作原理:
效能指標
資料庫系統的效能主要有兩個資源,解釋如下:
吞吐量 - 在給定時間間隔內可以完成的任務數量。透過並行處理許多事務,處理大量小型事務的系統可以提高吞吐量。
響應時間 - 從提交任務到完成單個任務所需的時間。處理大型事務的系統可以透過並行執行每個事務的子任務來提高響應時間和吞吐量。
並行資料庫的優勢
並行資料庫的優勢解釋如下:
速度
速度是並行資料庫的主要優勢。伺服器將使用者的資料庫請求分解成多個部分,並將每個部分發送到單獨的計算機。
我們最終處理這些部分並將輸出組合起來,然後返回給使用者。它加快了大多數資料請求的速度,從而可以更容易地訪問大型資料庫。
容量
隨著越來越多的使用者請求訪問資料庫,網路管理員會向並行伺服器新增更多機器,從而增加其整體容量。
例如,並行資料庫使大型線上商店能夠同時讓數千使用者訪問資訊。使用單個伺服器,這種級別的效能是不可行的。
可靠性
即使叢集中的任何計算機發生故障,正確配置的並行資料庫也將繼續工作。資料庫伺服器會檢測到來自單個計算機的無響應,並將功能重定向到其他計算機。
許多公司,例如線上零售商,都希望他們的資料庫能夠儘可能快地訪問。這就是並行資料庫的優勢所在。
此方法還有助於逐臺計算機進行計劃的維護。他們傳送伺服器命令解除安裝受影響的裝置,然後執行所需的維護和更新。
查詢優勢
並行查詢處理可以使以下型別的查詢受益:
掃描大量頁面但僅輸出幾行的 SELECT 語句。
包含 UNION、ORDER BY 或 DISTINCT 的 SELECT 語句,因為這些查詢可以並行填充工作表,並且可以使用並行排序。
使用合併連線的 SELECT 語句可以使用並行處理來掃描表,以及進行排序和合並。
最佳化器選擇重新格式化策略的 SELECT 語句,因為這些語句可以並行填充工作表,並且可以使用並行排序。
CREATE INDEX 語句,以及建立索引、唯一鍵和主鍵的 ALTER TABLE - ADD CONSTRAINT 子句。