什麼是CLIQUE演算法?
CLIQUE是第一個針對高維空間中維度增長子區域聚類的演算法。在維度增長子區域聚類中,聚類過程從一維子空間開始,向上擴充套件到更高維子空間。
因為CLIQUE將每個維度劃分為網格結構,並根據單元格包含的多個點來判斷單元格是否密集。它可以看作是基於密度和基於網格的聚類方法的整合。
CLIQUE聚類演算法的思想如下:
給定一大組多維資料點,資料空間通常不會被資料點均勻地佔據。CLIQUE的聚類識別空間中稀疏和“擁擠”的區域(或單元),從而找到資料集的完整分佈模式。
如果單元中包含的資料點比例超過輸入模型引數,則該單元是密集的。在CLIQUE中,一個聚類表示為一組最大連線的密集單元。
CLIQUE透過兩個過程實現多維聚類:第一個過程,CLIQUE將d維資料空間劃分為不重疊的矩形單元,識別這些單元中的密集單元。這對於每個維度(在一維中)都完成了。
學生搜尋空間的識別取決於關聯規則挖掘中使用的Apriori性質。通常,該性質利用搜索區域中專案的先驗知識,以便可以修剪部分割槽域。
CLIQUE的性質如下:如果一個k維單元是密集的,那麼它在(k-1)維空間中的投影也是密集的。也就是說,給定一個k維學生密集單元,如果它可以檢查其(k-1)維投影單元並發現一些非密集單元,那麼它可以理解k維單元也不可能是密集的。
因此,它可以從(k-1)維空間中找到的密集單元中生成k維空間中的潛在或學生密集單元。通常,最終搜尋的空間遠小於原始空間。密集單元被檢查以確定聚類。
在第二個過程中,CLIQUE對每個聚類進行最小描述,如下所示。對於每個聚類,它確定覆蓋連線的密集單元聚類的最大區域。它為每個聚類確定一個最小覆蓋(邏輯描述)。
CLIQUE必然會發現包含高密度聚類的最大維度子空間。它對輸入物件的順序不敏感,並且不假設任何規範的資料分佈。它隨輸入大小線性擴充套件,並且隨著資料中維度的增加,具有最佳的可擴充套件性。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP