資料探勘中約束的分類是什麼?


基於約束的演算法需要約束來減少頻繁項集生成階段的搜尋空間(關聯規則建立步驟與窮舉演算法完全相同)。

約束的重要性是明確的,它們只生成對客戶有意義的關聯規則。該方法非常簡單,規則空間減少了,剩餘規則使用這些約束。

有三種類型的約束,如下所示:

例項約束 - 例項約束定義瞭如何在聚類分析中對一對或一組例項進行分組。此類別中有兩種型別的約束,例如:

  • 必須連結約束 - 如果在兩個物件 x 和 y 上定義了必須連結約束,則在聚類分析的輸出中,x 和 y 必須分組到一個聚類中。這些必須連結約束是可傳遞的,即,必須連結(x, y) 和必須連結(y, z),則必須連結(x, z)。

  • 不能連結約束 - 不能連結約束與必須連結約束相反。如果在兩個物件 x 和 y 上定義了不能連結約束,則在聚類分析的輸出中,x 和 y 必須屬於不同的聚類。不能連結約束是可以推導的。如果不能連結(x, y),必須連結(x, x'),並且必須連結(y, y'),則不能連結(x', y')。

聚類約束 - 聚類約束對聚類定義了一個要求,可能利用聚類的屬性。例如,約束可以定義聚類中的最小物件數、聚類的最大直徑或聚類的形狀(例如,凸形)。為分割槽聚類方法定義的聚類數量可以標記為聚類約束。

相似性度量約束 - 相似性度量(包括歐幾里得距離)用於計算聚類分析中物件之間的相似性。在各種應用中,存在例外情況。相似性度量約束定義了相似性計算必須遵守的要求。

例如,它可以將人群聚類為廣場中變化的物件,而歐幾里得距離可以產生兩點之間的步行距離,相似性度量約束是執行最短距離的軌跡不能穿過牆壁。

另一種對聚類約束進行分類的方法考慮了約束必須遵守的嚴格程度。如果破壞約束的聚類是不可接受的,則約束是硬約束。如果破壞約束的聚類不是理想的,但在找不到更好的解決方案時是可以接受的,則約束是軟約束。軟約束也稱為偏好。

更新於:2022年2月18日

366 次瀏覽

開啟你的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.