資料探勘中的OLAP操作有哪些?
OLAP代表聯機分析處理 (On-Line Analytical Processing)。OLAP是軟體技術的一個組成部分,它允許分析師、經理和高管透過快速、一致、互動的方式訪問各種可能的檢視來深入瞭解資料,這些資料已從原始資訊轉換為反映企業實際維度的資訊,如客戶所瞭解的那樣。
OLAP伺服器向商務使用者提供來自資料倉庫或資料倉儲的多維資訊,而無需考慮資料的儲存方式或位置。OLAP伺服器的物理結構和執行應考慮資料儲存問題。
幾個OLAP資料立方體操作繼續實現這些多重檢視,從而能夠對現有資料進行互動式查詢和分析。因此,OLAP支援方便的互動式資料分析環境。
切片 (Slice) − 它描述子立方體以獲取更具體的資訊。這是透過選擇一個維度來執行的。
切塊 (Dice) − 它透過對兩個或多個維度進行選擇來描述子立方體。
上卷 (Roll-up) − 上卷允許使用者將資訊彙總到層次結構中更高的通用級別。顯示的上卷操作透過從城市級別到國家級別的區域層次結構的增長來聚合資料。換句話說,結果立方體按國家分組資料,而不是按城市分組資料。
當透過維度約簡執行上卷時,一個或多個維度將從給定的立方體中刪除。例如,考慮一個僅包含位置和時間兩個維度的銷售資料立方體。可以透過刪除時間維度來執行上卷,從而得到按位置而不是按位置和時間聚合的總銷售額。
下鑽 (Drill-down) − 下鑽是上卷的反向操作。它從較不詳細的資訊操作到較詳細的資訊。下鑽可以透過沿維度的概念層次向下移動或呈現更多維度來完成。下鑽透過從季度的級別下降到月份的精確級別來實現。結果資料立方體分析每月總銷售額,而不是按季度彙總。
視覺化 (Visualization) − 視覺化是指藉助全面的圖表、影像、列表、圖表和其他視覺化物件對資料進行視覺化表示。它允許使用者在很短的時間內簡單地理解資料並提取有用的資料、模式和趨勢。此外,它使資料易於理解。
換句話說,可以這樣說,以圖形結構表示資料,以便使用者可以簡單地理解資料趨勢的過程,這被稱為資料視覺化。