資料立方體計算的技術有哪些?
以下是高效計算資料立方體的一些通用最佳化技術:
排序、雜湊和分組 − 必須對維度屬性使用排序、雜湊和分組操作來重新排序和聚類關聯的元組。在立方體計算中,聚合是在共享相似維度值集的元組上實現的。因此,分析排序、雜湊和分組服務以訪問和分組此類資料以支援此類聚合的評估至關重要。
它可以按分支、日期和專案計算總銷售額。按分支排序元組或單元格,然後按日期排序,然後按專案名稱分組,可能會更有效。在資料庫研究領域,對大型資料集進行此類操作的有效效能已被廣泛考慮。
這種效能可以延續到資料立方體計算。此方法還可以用於實現共享排序(即,當使用基於排序的技術時,在不同的cuboid之間共享排序成本),或實現共享分割槽(即,當使用基於雜湊的演算法時,在不同的cuboid之間共享分割槽成本)。
同時聚合和快取中間結果 − 在立方體計算中,從先前計算的較低級別聚合而不是從基本事實表計算較高級別聚合更有效。此外,同時從快取的中間計算結果進行聚合可以減少代價高昂的磁碟輸入/輸出 (I/O) 操作。
例如,它可以計算按分支的銷售額,它可以使用從包括按分支和日期的銷售額的較低級別cuboid計算更改的中間結果。此方法可以用於實現攤銷掃描(即,同時計算儘可能多的cuboid以攤銷磁碟讀取)。
當存在多個子立方體時,從最小的子立方體進行聚合 − 當存在多個子立方體時,通常從最小、先前計算的子立方體計算所需的父(即更通用的)立方體更有效。
可以探索 Apriori 剪枝方法來高效計算冰山立方體 − 資料立方體環境下的 Apriori 屬性定義如下:如果給定單元格不滿足最小支援度,則該單元格的任何後代(即更具體的單元格)都不會滿足最小支援度。此屬性可用於大大減少冰山立方體的計算量。
冰山立方體的描述包括一個冰山條件,這是一個對要物化的單元格的約束。一個通用的冰山條件是單元格應滿足包括最小計數或總和的最小支援度閾值。在此術語中,Apriori 屬性可用於縮短對單元格後代的檢查。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP