為什麼需要進行分析性特徵描述和屬性相關性分析,以及如何進行這些分析?
這是一種用於預處理資料的統計方法,用於過濾掉不相關的屬性或對相關屬性進行排序。屬性相關性分析的度量可用於識別概念描述過程中可以被取消授權的不相關屬性。將此預處理步驟納入類特徵描述或比較中被定義為分析性特徵描述。
資料區分建立區分規則,即比較目標類和對比類之間物件的一般特徵。
它是將目標類資料物件的一般特徵與來自一個或一組對比類物件的的一般特徵進行比較。使用者可以定義目標類和對比類。用於資料區分的方法與用於資料特徵描述的方法非常相似,區別在於資料區分結果包括比較度量。
屬性相關性分析的原因
屬性相關性分析有以下幾個原因:
它可以決定哪些維度必須包含在內。
它可以產生高度的概括性。
它可以減少支援我們輕鬆讀取模式的屬性數量。
屬性相關性分析背後的基本概念是評估一些可以計算屬性相對於給定類或概念的相關性的度量。此類度量包括資訊增益、模糊性和相關係數。
概念描述的屬性相關性分析實現如下:
**資料收集** - 它可以透過查詢處理收集目標類和對比類的的資料。
**使用保守的AOI進行初步相關性分析** - 此步驟識別一組要使用所選相關性度量的維度和屬性。
AOI可用於透過消除具有大量不同值的屬性來對資料進行初步分析。它可以是保守的,實施的AOI應採用設定得相當大的屬性泛化閾值,以使更多屬效能夠透過所選度量在進一步的相關性分析中得到處理。
**移除** - 此過程使用所選的相關性分析度量去除不相關和弱相關的屬性。
**使用AOI生成概念描述** - 它可以使用一組不太保守的屬性泛化閾值來實現AOI。如果描述性挖掘功能是類特徵描述,則現在僅包含原始目標類工作關係。
如果描述性挖掘功能是類特徵描述,則僅包含原始目標類工作關係。如果描述性挖掘功能是類特徵描述,則僅包含原始目標類工作關係。如果描述性挖掘功能是類比較,則包含原始目標類工作關係和原始對比類工作關係。