scipy.cluster.vq 模組中哪個函式用於對每個特徵維度上的觀測值進行歸一化?


在實施 k 均值演算法之前,重新縮放觀測集的每個特徵維度總是有益的。函式 scipy.cluster.vq.whiten(obs, check_finite = True) 用於此目的。為了使其具有單位方差,它將觀測值的每個特徵維度除以其標準差 (SD)。

引數

以下是函式 scipy.cluster.vq.whiten(obs, check_finite = True) 的引數:−

  • obs− ndarray

它是一個要重新縮放的陣列,其中每一行都是一個觀測值,列是在每次觀測期間看到的特徵。示例如下:−

obs = [[ 1., 1., 1.],
   [ 2., 2., 2.],
   [ 3., 3., 3.],
   [ 4., 4., 4.]]
  • check_finite− bool,可選

此引數用於檢查輸入矩陣是否僅包含有限數字。停用此引數可能會提高效能,但如果觀測值確實包含無窮大,也可能導致某些問題,例如崩潰或不終止。此引數的預設值為 True

返回值

它返回一個數組,其中包含按每列的 SD 縮放的 obs 中的值。

示例

import numpy as np
from scipy.cluster.vq import whiten
observations = np.array([[2.9, 1.3, 1.9],
   [1.7, 3.2, 1.1],
   [1.0, 0.2, 1.7,]])
whiten(observations)

輸出

array([[3.69627581, 1.04908478, 5.58930985],
   [2.16678237, 2.58236253, 3.23591623],
   [1.27457787, 0.16139766, 5.00096145]])

更新於: 2021年11月23日

105 次檢視

開啟您的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.