什麼是基於原型的聚類？

資料探勘資料庫資料結構

在基於原型的聚類中，一個簇是一組物件，其中某些物件更接近於代表該簇的原型，而不是更接近於其他簇的原型。一個簡單的基於原型的聚類演算法，需要簇中元素的中心作為簇的原型。

基於原型的聚類有各種方法，如下所示：

物件可以屬於多個簇。此外，一個物件屬於每個簇都有一定的權重。這種方法解決了某些物件與多個簇原型同樣接近的事實。
一個簇被建模為一個統計分佈，即物件是由一個統計分佈中的隨機相位產生的，該分佈的特徵是多個統計引數，包括均值和方差。這種觀點概括了原型的概念，並允許使用完善的統計方法。
簇被限制為具有恆定的關聯性。這些關係是約束，定義了鄰域關係，例如兩個簇彼此鄰近的程度。約束簇之間的關係可以定義資料的執行和視覺化。

模糊C均值利用模糊邏輯和模糊集理論中的概念來提出一種聚類設計，它類似於K均值，但不需要將一個點硬性分配到一個簇中。

混合模型聚類採用了一種方法，即一組簇可以建模為分佈的組合，每個簇一個。聚類方案依賴於自組織對映（SOM），在需要簇彼此具有預先指定關聯性的結構（包括二維網格結構）中實現聚類。

**模糊聚類** - 如果資料物件分佈在獨立性良好的集合中，那麼將物件清晰地劃分為不相交的簇似乎是一種理想的方法。但在某些情況下，資料集中的物件不能被劃分為獨立性良好的簇，並且在將物件分配到特定簇時會存在一定的任意性。

考慮一個位於兩個簇邊界附近的物件，但更接近其中一個簇。在某些情況下，為每個物件和每個簇分配一個權重可能更合適，該權重表示物件屬於該簇的程度。

機率方法也可以支援這樣的權重。雖然機率方法在多種情況下都很有益，但在某些時候，確定合適的統計模型很複雜。在一般情況下，需要非機率聚類方法來提供相同的功能。

Ginni

更新於： 2022年2月14日

2K+ 瀏覽量

開啟你的職業生涯

透過完成課程獲得認證

廣告

© . All rights reserved.