使用 SciPy 透過將隨機資料分成 2 個簇來實現 K 均值聚類？

K 均值聚類演算法，也稱為扁平聚類，是一種計算一組未標記資料中的簇和簇中心（質心）的方法。它會不斷迭代，直到找到最佳質心。對於一個簇，我們可以認為它是一組資料點，其點間距離與簇外點到該簇的距離相比很小。在 K 均值演算法中，“K”表示從未標記資料中標識出的簇數。

給定一組最初的 K 箇中心後，可以透過執行以下步驟使用 SciPy 庫完成 K 均值聚類演算法 −

步驟 1− 資料點規範化

步驟 2− 計算稱為程式碼的質心。在此處，二位質心陣列稱為碼本。

步驟 3− 形成簇和分配資料點。這意味著從碼本進行對映。

示例

#importing the required Python libraries :
import numpy as np
from numpy import vstack,array
from numpy.random import rand
from scipy.cluster.vq import whiten, kmeans, vq
from pylab import plot,show

#Random data generation :
data = vstack((rand(200,2) + array([.5,.5]),rand(150,2)))

#Normalizing the data :
data = whiten(data)

# computing K-Means with K = 2 (2 clusters)
centroids, mean_value = kmeans(data, 2)
print("Code book :
", centroids, "
")
print("Mean of Euclidean distances :", mean_value.round(4))

# mapping the centroids
clusters, _ = vq(data, centroids)
print("Cluster index :", clusters, "
")
#Plotting using numpy's logical indexing
plot(data[clusters==0,0],data[clusters==0,1],'ob',data[clusters==1,0],data[clusters==1,1],'or')
plot(centroids[:,0],centroids[:,1],'sg',markersize=8)
show()

輸出

Code book :
[[2.68379425 2.77892846]
[1.34079677 1.27029728]]


Mean of Euclidean distances : 0.9384

Cluster index : [0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 1 0 0 1 1 0
0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1
0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 1 0 1 1 1 1 0 1 1 1 1 0 1 1 1 1 1
1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 1
1 1 1 1 1 1 1 0 1 1 1 0 1 0 1 1 1 1 1 0 1 0 1 1 1 0 1 0 1 1 1 1 1 1 1 1 0
1 1 1 1 1 0 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 1 1 0 0 1 1 0 0 1 0 1 1 1 1
1 1 0 1 1 1 1 1 1 0 1 1 0 1 1 1 0]

Gaurav Kumar

更新於:14-Dec-2021

1360 次檢視

開啟您的職業生涯

完成課程以獲得認證

開始

使用 SciPy 透過將隨機資料分成 2 個簇來實現 K 均值聚類？

示例

輸出

開啟您的 職業生涯

開啟您的職業生涯