什麼是 scipy.cluster.vq.kmeans() 方法?


scipy.cluster.vq.kmeans(obs, k_or_guess, iter=20, thresh=1e- 05, check_finite=True) 方法透過對一組觀測向量執行 k 均值演算法來形成 k 個聚類。為了確定質心的穩定性,此方法使用閾值來比較觀測值與其對應質心之間平均歐幾里得距離的變化。此方法的輸出是一個程式碼簿,用於對映質心到程式碼,反之亦然。

以下是其引數的詳細說明:

引數

  • obs− ndarray

    它是一個 'M' 行 'N' 列的陣列,其中每一行是一個觀測值,列是在每次觀測期間看到的特徵。在使用之前,必須使用 whiten() 函式對這些特徵進行白化處理。

  • k_or_guess− int 或 ndarray

    它是要生成的質心數量。生成後,每個質心都會被賦予一個程式碼。此程式碼也是程式碼簿矩陣中質心的行索引。最初,k 個質心將從觀測矩陣中隨機選擇。

  • iter− int,可選

    此引數表示執行 k 均值演算法的次數,以便它返回具有最低失真的程式碼簿。如果您已經使用 k_or_guess 引數指定了初始質心,則應忽略此引數。

  • thresh− float,可選

    此引數表示閾值。如果自上次迭代以來的失真變化小於或等於此閾值,則演算法將預設終止。

  • check_finite− bool,可選

    此引數用於檢查輸入矩陣是否僅包含有限數字。停用此引數可能會提高效能,但如果觀測值確實包含無窮大,也可能導致一些問題,例如崩潰或不終止。此引數的預設值為 True

返回值

  • code− ndarray

    它返回一個 k 行 N 列的 k 個質心陣列,其中第 j 個質心程式碼簿用程式碼 j 表示。此程式碼簿給出看到的最低失真。

  • distortion− float

    這是傳遞的觀測向量與生成的質心之間的平均歐幾里得距離。

更新於:2021年11月24日

147 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.