什麼是發現驅動式探索?
發現驅動式探索是一種立方體探索方法。在發現驅動式探索中,預先計算的指示資料異常的度量用於在資料分析過程中指導使用者,在所有聚合級別上。它將這些度量稱為異常指標。
直觀地說,異常是指與基於統計模型的預期值存在顯著差異的資料立方體單元格值。該模型處理了度量值在所有應用於單元格的維度上的變化和模式。
例如,如果對商品銷售資料的分析確認與幾個月相比,12 月份的銷售額有所增加,這在時間維度上可以被視為異常。但是,如果考慮商品維度,則它不是異常,因為12 月份其他商品的銷售額也有類似的增長。
該模型處理資料立方體某些聚合分組中的未知異常。視覺線索(包括背景顏色)用於根據預先計算的異常指標跟蹤每個單元格的異常程度。
三個度量用作異常指標,以提供識別資料異常的功能。這些度量表示單元格中數量相對於其預期值的影響的驚訝程度。這些度量針對所有聚合級別計算並與每個單元格相關聯。它們如下所示:
SelfExp - 這表示單元格值相對於相同聚合級別的其他單元格的驚訝程度。
InExp - 這表示如果可以從中向下鑽取,則單元格下方某個位置的驚訝程度。
PathExp - 這表示從單元格到每個向下鑽取路徑的驚訝程度。
例如,假設您想分析 AllElectronics 每月的銷售額與上個月的百分比差異。包含的維度是商品、時間和區域。
要檢視異常指標,您需要單擊螢幕上標記為“突出顯示異常”的按鈕。這會將 SelfExp 和 InExp 值解釋為視覺線索,並與每個單元格一起顯示。每個單元格的背景顏色取決於其 SelfExp 值。
此外,將在每個單元格周圍繪製一個框,其中框的粗細和顏色是其 InExp 值的函式。粗框表示高 InExp 值。在這兩種情況下,顏色越深,異常程度越高。
沿著商品進行向下鑽取會導致立方體切片中顯示每個商品隨時間推移的銷售額。它可以呈現多個不同的銷售值以進行分析。可以透過按下突出顯示異常按鈕來顯示視覺線索,從而將重點放在異常上。
資料結構
網路
RDBMS
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP