COWEB的工作原理是什麼?


COBWEB 逐步將物件包含到分類樹中。COBWEB 沿著分配路徑向下遍歷樹,在方法中重新整理計數,以搜尋“最佳宿主”或定義物件的節點。

此決策取決於將物件臨時放置在每個節點中並計算結果劃分的類別效用。導致最高元素效用的放置必須是物件的最佳宿主。

COBWEB 還計算如果為物件建立新節點可能產生的分割槽的類別效用。物件位於當前類中,或為其生成一個新類,這取決於具有最大類別效用值的劃分。COBWEB 具有自動調整分割槽中多個類的能力。它不需要依賴使用者提供此類輸入引數。

COBWEB 具有兩個運算子,有助於使其不易受輸入順序的影響。這些是合併和拆分。當整合一個物件時,將對兩個最佳宿主進行處理以合併到一個類中。

此外,COBWEB 考慮在當前類別之間劃分良好宿主的子節點。這些決策取決於類別效用。合併和拆分運算子使 COBWEB 能夠實現雙向搜尋,例如,合併可以撤消先前的拆分。

COWEB 的侷限性

COWEB 的侷限性如下:

它依賴於獨立屬性上的機率分佈在統計上彼此分離的假設。此假設並不總是正確的,因為屬性之間的相關性通常存在。

此外,聚類的機率分佈描述使其重新整理和儲存聚類變得非常昂貴。當屬性具有大量值時尤其如此,因為時間和空間複雜度不僅取決於幾個屬性,還取決於每個屬性的幾個值。

此外,對於傾斜的輸入記錄,分類樹不是高度平衡的,這會導致時間和空間複雜度急劇下降。

CLASSIT 是 COBWEB 的擴充套件,用於連續(或實值)資訊的增量聚類。它為每個節點中每個單個屬性儲存連續正態分佈(即均值和標準差),並且需要一個修改後的類別效用度量,該度量是連續屬性上的基本度量,而不是像 COBWEB 中那樣是離散屬性上的總和。

更新於: 2022年2月17日

400 次瀏覽

開啟你的 職業生涯

完成課程獲得認證

開始學習
廣告