屬性泛化規則是什麼?


屬性泛化依賴於以下規則:如果原始工作關係中某個屬性存在大量不同的值,並且存在一組該屬性的泛化運算子,則應選擇並應用一個泛化運算子於該屬性。

此規則基於以下推理。使用泛化服務來泛化工作關係中元組或規則內的屬性值,將使規則涵蓋更多初始資料元組,從而泛化其定義的概念。這對應於定義為從例項中爬升知識泛化樹或概念樹上升的泛化規則。

基於所包含的屬性或應用程式,使用者可能更傾向於讓某些屬性保持中等較低的抽象方法,而將其他屬性泛化為較高的層次。屬性泛化到多高程度的控制通常是主觀的。此階段的控制稱為屬性泛化控制。

如果屬性泛化“過高”,則可能導致過度泛化,導致生成的規則無法進行很好的描述。換句話說,如果屬性沒有泛化到“足夠高的級別”,則可能導致泛化不足,從而獲得的規則也無法提供資訊。因此,必須在面向屬性的泛化中取得平衡。

有許多可能的控制泛化過程的方法,如下所示:

**屬性泛化閾值控制** - 第一種技術,稱為屬性泛化閾值控制,要麼為某些屬性設定一個泛化閾值,要麼為每個屬性設定一個閾值。如果屬性中多個不同值的個數高於屬性閾值,則必須實現屬性移除或屬性泛化。

資料探勘系統通常具有預設的屬性閾值,通常範圍為 2 到 8,並且必須允許專業人員和使用者更改閾值。如果使用者認為某個特定屬性的泛化程度過高,則可以提高閾值。

**泛化關係閾值控制** - 第二種技術,稱為泛化關係閾值控制,為泛化關係設定閾值。如果泛化關係中多個(不同)元組的個數高於閾值,則必須實現泛化。

因此,必須不再進行進一步的泛化。此類閾值也可以預設在資料探勘系統中(通常在 10 到 30 的範圍內),或者由專業人員或使用者設定,並且必須可調整。例如,如果使用者認為泛化關係太小,則可以增加閾值,這表示向下鑽取。

更新於:2022年2月16日

812 次瀏覽

開啟你的職業生涯

完成課程獲得認證

開始學習
廣告