多維梯度分析中的約束型別有哪些?
維度災難和對可理解結果的需求對找到立方體梯度問題的有效且可擴充套件的解決方案提出了嚴峻挑戰。它可以被限制為立方體梯度問題的一個有趣版本,稱為約束多維梯度分析。它可以減少搜尋空間並得出有趣的結果。
以下列出了幾種約束型別:
顯著性約束 - 這使得它可以僅測試資料中具有特定“統計顯著性”的單元格,包括包含至少定義數量的基本單元格或至少特定總銷售額。在資料立方體上下文中,此約束有助於作為冰山條件,從解釋集中修剪大量瑣碎的單元格。
探測約束 - 從一些可能的單元格中選擇一個單元格子集(稱為探測單元格)作為檢查的起點。因為立方體梯度問題需要將立方體中的每個單元格與多個單元格進行比較,這些單元格例如是給定單元格的專門化、泛化或變異,它派生出一組與資料立方體中度量值的顯著變化相關的相同單元格特徵。
給定三個單元格 a、b 和 c,如果 a 是 b 的描述,則可以說它是 b 的後代,在這種方法中,b 是 a 的泛化或祖先。如果兩個單元格在除一個維度之外的所有維度中都具有相同的值,則單元格 c 是 a 的變異,其中它們變化的維度不能具有“*”的值。
單元格 a 和 c 被視為兄弟姐妹。即使只處理冰山立方體,也可以生成多個對。探測約束使使用者能夠定義一組對分析服務感興趣的單元格。在這種方法中,研究僅針對這些單元格及其與等效祖先、後代和兄弟姐妹的關係。
梯度約束 - 這指定了使用者對梯度(度量變化)的興趣範圍。使用者通常只對比較下的單元格(扇區)之間特定方法的變化感興趣。
例如,它可能僅對平均利潤比探測單元格的平均利潤增加超過 40% 的那些單元格感興趣。此類變化可以定義為比較下的單元格的特定度量值之間比率或差異結構中的閾值。從探測單元格獲取變化的單元格定義為梯度單元格。
廣告