什麼是基於原型的聚類?


在基於原型的聚類中,一個簇是一組物件,其中某些物件更接近於代表該簇的原型,而不是更接近於其他簇的原型。一個簡單的基於原型的聚類演算法,需要簇中元素的中心作為簇的原型。

基於原型的聚類有各種方法,如下所示:

  • 物件可以屬於多個簇。此外,一個物件屬於每個簇都有一定的權重。這種方法解決了某些物件與多個簇原型同樣接近的事實。

  • 一個簇被建模為一個統計分佈,即物件是由一個統計分佈中的隨機相位產生的,該分佈的特徵是多個統計引數,包括均值和方差。這種觀點概括了原型的概念,並允許使用完善的統計方法。

  • 簇被限制為具有恆定的關聯性。這些關係是約束,定義了鄰域關係,例如兩個簇彼此鄰近的程度。約束簇之間的關係可以定義資料的執行和視覺化。

模糊C均值利用模糊邏輯和模糊集理論中的概念來提出一種聚類設計,它類似於K均值,但不需要將一個點硬性分配到一個簇中。

混合模型聚類採用了一種方法,即一組簇可以建模為分佈的組合,每個簇一個。聚類方案依賴於自組織對映(SOM),在需要簇彼此具有預先指定關聯性的結構(包括二維網格結構)中實現聚類。

**模糊聚類** - 如果資料物件分佈在獨立性良好的集合中,那麼將物件清晰地劃分為不相交的簇似乎是一種理想的方法。但在某些情況下,資料集中的物件不能被劃分為獨立性良好的簇,並且在將物件分配到特定簇時會存在一定的任意性。

考慮一個位於兩個簇邊界附近的物件,但更接近其中一個簇。在某些情況下,為每個物件和每個簇分配一個權重可能更合適,該權重表示物件屬於該簇的程度。

機率方法也可以支援這樣的權重。雖然機率方法在多種情況下都很有益,但在某些時候,確定合適的統計模型很複雜。在一般情況下,需要非機率聚類方法來提供相同的功能。

更新於: 2022年2月14日

2K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.