找到關於 Scipy 的46 篇文章

scipy.cluster.vq.kmeans() 和 scipy.cluster.vq.kmeans2() 方法有什麼區別?

Gaurav Kumar
更新於 2021-11-24 08:11:58

419 次檢視

scipy.cluster.vq() 有兩種方法可以實現 k 均值聚類,分別是 kmeans() 和 kmeans2()。這兩種方法的工作方式存在顯著差異。讓我們瞭解一下 -scipy.cluster.vq.kmeans(obs, k_or_guess, iter=20, thresh=1e-05, check_finite=True)- kmeans() 方法透過對一組觀測向量執行 k 均值演算法來形成 k 個聚類。為了確定質心的穩定性,此方法使用閾值來比較觀測值與其對應質心之間平均歐氏距離的變化。此方法的輸出是將質心對映到程式碼的程式碼簿,反之亦然。scipy.cluster.vq.kmeans2(data, k, iter=10, thresh=1e-05, minit='random', missing='warn', check_finite=True)- ... 閱讀更多

什麼是 scipy.cluster.vq.kmeans2() 方法?

Gaurav Kumar
更新於 2021-11-24 08:10:55

163 次檢視

scipy.cluster.vq.kmeans2(data, k, iter=10, thresh=1e-05, minit='random', missing='warn', check_finite=True)- kmeans2() 方法透過執行 k 均值演算法將一組觀測向量分類為 k 個聚類。為了檢查收斂性,kmeans2() 方法不使用閾值。它具有其他引數來決定質心初始化方法、處理空聚類以及驗證輸入矩陣是否僅包含有限數字。以下是其引數的詳細說明 -引數data- ndarray它是一個 'M'x'N' 陣列,其中 M 個觀測值在 N 維。k- int 或 ndarray此引數表示要形成的聚類數量和質心 ... 閱讀更多

什麼是 scipy.cluster.vq.kmeans() 方法?

Gaurav Kumar
更新於 2021-11-24 08:07:49

148 次檢視

scipy.cluster.vq.kmeans(obs, k_or_guess, iter=20, thresh=1e- 05, check_finite=True) 方法透過對一組觀測向量執行 k 均值演算法來形成 k 個聚類。為了確定質心的穩定性,此方法使用閾值來比較觀測值與其對應質心之間平均歐氏距離的變化。此方法的輸出是將質心對映到程式碼的程式碼簿,反之亦然。以下是其引數的詳細說明 -引數obs- ndarray它是一個 'M'x'N' 陣列,其中每一行都是一個觀測值,列是在每次觀測期間看到的特徵。在使用之前,這些特徵 ... 閱讀更多

scipy.cluster.vq 模組的哪個函式用於將程式碼簿中的程式碼分配給觀測值?

Gaurav Kumar
更新於 2021-11-24 08:02:10

147 次檢視

在實現 k 均值演算法之前,scipy.cluster.vq.vq(obs, code_book, check_finite = True) 用於從程式碼簿中為每個觀測值分配程式碼。它首先將 'M'x'N' obs 陣列中的每個觀測向量與程式碼簿中的質心進行比較。比較完成後,它將程式碼分配給最接近的質心。它需要 obs 陣列中具有單位方差的特徵,我們可以透過將它們傳遞給 scipy.cluster.vq.whiten(obs, check_finite = True) 函式來實現。引數以下是函式 scipy.cluster.vq.vq(obs, code_book, check_finite = True) 的引數 -obs- ndarray它是一個 'M'x'N' 陣列,其中每一行都是一個觀測值,並且 ... 閱讀更多

scipy.cluster.vq 模組的哪個函式用於在每個特徵維度上規範化觀測值?

Gaurav Kumar
更新於 2021-11-23 13:23:51

105 次檢視

在實現 k 均值演算法之前,重新縮放觀測集的每個特徵維度始終是有益的。函式 scipy.cluster.vq.whiten(obs, check_finite = True) 用於此目的。為了使其具有單位方差,它將觀測值的每個特徵維度除以其標準差 (SD)。引數以下是函式 scipy.cluster.vq.whiten(obs, check_finite = True) 的引數 -obs- ndarray它是一個要重新縮放的陣列,其中每一行都是一個觀測值,列是在每次觀測期間看到的特徵。下面給出了示例 -obs = [[ 1., 1., 1.], [ 2., 2., 2.], ... 閱讀更多

我們如何呼叫 NumPy 和 SciPy 的文件?

Gaurav Kumar
更新於 2021-11-23 13:15:28

145 次檢視

如果您不確定如何在 NumPy 和 SciPy 中使用特定函式或變數,您可以使用 '?' 呼叫文件。在 Jupyter notebook 和 IPython shell 中,我們可以如下呼叫文件 -示例如果您想知道 NumPy sin() 函式,可以使用以下程式碼 -import numpy as np np.sin?輸出我們將獲得有關 sin() 函式的詳細資訊,如下所示 -我們還可以使用雙問號 (??) 檢視原始碼,如下所示 -import numpy as np np.sin??同樣,如果您想檢視 ... 閱讀更多

使用 SciPy 庫實現糖尿病資料集的 K 均值聚類

Gaurav Kumar
更新於 2021-12-14 08:59:17

721 次檢視

我們將在此處使用的皮馬印第安人糖尿病資料集最初來自美國國家糖尿病、消化和腎臟疾病研究所。根據以下診斷因素,此資料集可用於將患者置於糖尿病或非糖尿病聚類中 -妊娠葡萄糖血壓皮膚厚度胰島素BMI糖尿病譜系函式年齡您可以在 Kaggle 網站上以 .CSV 格式獲取此資料集。示例以下示例將使用 SciPy 庫從皮馬印第安人糖尿病資料集中建立兩個聚類,即糖尿病和非糖尿病。#匯入所需的 Python 庫:import matplotlib.pyplot as plt import numpy as np from scipy.cluster.vq import whiten, kmeans, vq ... 閱讀更多

透過將隨機資料分成 3 個聚類,使用 SciPy 實現 K 均值聚類?

Gaurav Kumar
更新於 2021-12-14 08:48:44

147 次檢視

是的,我們還可以透過將隨機資料分成 3 個聚類來實現 K 均值聚類演算法。讓我們透過以下示例瞭解一下 -示例#匯入所需的 Python 庫:import numpy as np from numpy import vstack, array from numpy.random import rand from scipy.cluster.vq import whiten, kmeans, vq from pylab import plot, show #隨機資料生成:data = vstack((rand(200, 2) + array([.5, .5]), rand(150, 2))) #規範化資料:data = whiten(data) # 使用 K = 3 計算 K 均值(3 個聚類)質心,均值 = kmeans(data, 3) print("程式碼簿:", centroids, "") print("歐氏距離的均值:", mean_value.round(4)) ... 閱讀更多

透過將隨機資料分成 2 個聚類,使用 SciPy 實現 K 均值聚類?

Gaurav Kumar
更新於 2021-12-14 08:42:53

360 次檢視

K 均值聚類演算法,也稱為扁平聚類,是一種在未標記資料集中計算聚類和聚類中心(質心)的方法。它會迭代直到找到最佳質心。我們可能認為聚類是一組資料點,其點間距離與該聚類外部的點距離相比很小。從未標記資料中識別的聚類數量在 K 均值演算法中用 'K' 表示。給定一組初始的 K 箇中心,可以使用 SciPy 庫透過執行以下步驟來完成 K 均值聚類演算法 -步驟 1- 資料點 ... 閱讀更多

哪個 SciPy 包用於實現聚類?

Gaurav Kumar
更新於 2021年11月23日 12:49:59

144 次檢視

聚類是眾多非常有用的無監督機器學習方法之一。它用於查詢輸入資料樣本之間的關係模式和相似性。在找到這些模式後,無監督演算法會將具有相似性的資料樣本聚類到組中,如下圖所示 -異常檢測、影像分割、醫學影像、社交網路分析和市場細分是一些常見的聚類應用。K均值和層次聚類是兩種最常見的聚類形式。為了實現聚類,SciPy 為我們提供了一個聚類包(scipy.cluster),它進一步包含以下兩個模組:scipy.cluster.vq 模組 - 此 SciPy 模組提供了用於 k 均值... 閱讀更多

廣告

© . All rights reserved.