什麼是CLIQUE演算法?


CLIQUE是第一個針對高維空間中維度增長子區域聚類的演算法。在維度增長子區域聚類中,聚類過程從一維子空間開始,向上擴充套件到更高維子空間。

因為CLIQUE將每個維度劃分為網格結構,並根據單元格包含的多個點來判斷單元格是否密集。它可以看作是基於密度和基於網格的聚類方法的整合。

CLIQUE聚類演算法的思想如下:

  • 給定一大組多維資料點,資料空間通常不會被資料點均勻地佔據。CLIQUE的聚類識別空間中稀疏和“擁擠”的區域(或單元),從而找到資料集的完整分佈模式。

  • 如果單元中包含的資料點比例超過輸入模型引數,則該單元是密集的。在CLIQUE中,一個聚類表示為一組最大連線的密集單元。

CLIQUE透過兩個過程實現多維聚類:第一個過程,CLIQUE將d維資料空間劃分為不重疊的矩形單元,識別這些單元中的密集單元。這對於每個維度(在一維中)都完成了。

學生搜尋空間的識別取決於關聯規則挖掘中使用的Apriori性質。通常,該性質利用搜索區域中專案的先驗知識,以便可以修剪部分割槽域。

CLIQUE的性質如下:如果一個k維單元是密集的,那麼它在(k-1)維空間中的投影也是密集的。也就是說,給定一個k維學生密集單元,如果它可以檢查其(k-1)維投影單元並發現一些非密集單元,那麼它可以理解k維單元也不可能是密集的。

因此,它可以從(k-1)維空間中找到的密集單元中生成k維空間中的潛在或學生密集單元。通常,最終搜尋的空間遠小於原始空間。密集單元被檢查以確定聚類。

在第二個過程中,CLIQUE對每個聚類進行最小描述,如下所示。對於每個聚類,它確定覆蓋連線的密集單元聚類的最大區域。它為每個聚類確定一個最小覆蓋(邏輯描述)。

CLIQUE必然會發現包含高密度聚類的最大維度子空間。它對輸入物件的順序不敏感,並且不假設任何規範的資料分佈。它隨輸入大小線性擴充套件,並且隨著資料中維度的增加,具有最佳的可擴充套件性。

更新於:2022年2月17日

2K+ 次瀏覽

開啟你的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.