什麼是CLIQUE演算法？

資料探勘資料庫資料結構

CLIQUE是第一個針對高維空間中維度增長子區域聚類的演算法。在維度增長子區域聚類中，聚類過程從一維子空間開始，向上擴充套件到更高維子空間。

因為CLIQUE將每個維度劃分為網格結構，並根據單元格包含的多個點來判斷單元格是否密集。它可以看作是基於密度和基於網格的聚類方法的整合。

CLIQUE聚類演算法的思想如下：

給定一大組多維資料點，資料空間通常不會被資料點均勻地佔據。CLIQUE的聚類識別空間中稀疏和“擁擠”的區域（或單元），從而找到資料集的完整分佈模式。
如果單元中包含的資料點比例超過輸入模型引數，則該單元是密集的。在CLIQUE中，一個聚類表示為一組最大連線的密集單元。

CLIQUE透過兩個過程實現多維聚類：第一個過程，CLIQUE將d維資料空間劃分為不重疊的矩形單元，識別這些單元中的密集單元。這對於每個維度（在一維中）都完成了。

學生搜尋空間的識別取決於關聯規則挖掘中使用的Apriori性質。通常，該性質利用搜索區域中專案的先驗知識，以便可以修剪部分割槽域。

CLIQUE的性質如下：如果一個k維單元是密集的，那麼它在(k-1)維空間中的投影也是密集的。也就是說，給定一個k維學生密集單元，如果它可以檢查其(k-1)維投影單元並發現一些非密集單元，那麼它可以理解k維單元也不可能是密集的。

因此，它可以從(k-1)維空間中找到的密集單元中生成k維空間中的潛在或學生密集單元。通常，最終搜尋的空間遠小於原始空間。密集單元被檢查以確定聚類。

在第二個過程中，CLIQUE對每個聚類進行最小描述，如下所示。對於每個聚類，它確定覆蓋連線的密集單元聚類的最大區域。它為每個聚類確定一個最小覆蓋（邏輯描述）。

CLIQUE必然會發現包含高密度聚類的最大維度子空間。它對輸入物件的順序不敏感，並且不假設任何規範的資料分佈。它隨輸入大小線性擴充套件，並且隨著資料中維度的增加，具有最佳的可擴充套件性。

Ginni

更新於：2022年2月17日

2K+ 次瀏覽

開啟你的職業生涯

完成課程獲得認證

廣告

© . All rights reserved.