計算給定 NumPy 陣列的均值、標準差和方差
均值、標準差和方差是用於描述給定資料集資料分佈的統計量度。在 Numpy 庫中,我們有函式可以計算陣列的均值、標準差和方差。讓我們逐一詳細瞭解。
均值
均值也稱為平均值,它是陣列中所有元素的總和除以元素總數。它用於表示資料的集中趨勢。
語法
以下是將均值函式應用於陣列的語法:
numpy.mean(arr)
其中
Numpy 是庫。
mean 是函式。
arr 是輸入陣列。
示例
在以下示例中,我們使用mean()函式計算給定輸入一維陣列的均值。
import numpy as np a = np.array([22,1,7,14,5,2]) print("The input array:",a) mean_array = np.mean(a) print("The mean of the given input array:",mean_array)
輸出
以下是給定輸入陣列的均值輸出。
The input array: [22 1 7 14 5 2]
The mean of the given input array: 8.5
示例
讓我們再看一個使用 NumPy 陣列的 mean() 函式計算二維陣列均值的示例。
import numpy as np a = np.array([[34,23],[90,34],[43,23],[10,34]]) print("The input array:",a) mean_array = np.mean(a) print("The mean of the given input 2-d array:",mean_array)
輸出
以下是執行程式碼時上述程式碼的輸出:
The input array: [[34 23] [90 34] [43 23] [10 34]] The mean of the given input 2-d array: 36.375
示例
在這裡,我們使用 NumPy 陣列的 mean() 函式計算三維陣列的均值。
import numpy as np a = np.array([[[34,23],[90,34]],[[43,23],[10,34]]]) print("The input array:",a) mean_array = np.mean(a) print("The mean of the given input 3-d array:",mean_array)
輸出
The input array: [[[34 23] [90 34]] [[43 23] [10 34]]] The mean of the given input 3-d array: 36.375
方差
這用於查詢資料在給定資料集中是如何分佈的。它是透過計算每個資料點與其均值平方差的平均值來計算的。從數學上講,查詢方差的公式如下所示。
Variance = (1/n) * sum((xi - mean)2)
其中,
n 是資料點的數量。
xi 是給定資料的第 i 個數據點。
mean 是給定資料的平均值
高方差
高方差
高方差表示資料值分佈在較大的範圍內,而低方差表示值聚集在資料值的均值周圍。在 Numpy 中,我們有 var() 函式來計算給定陣列的方差。
語法
以下是將方差函式用於陣列的語法。
numpy.var(arr)
其中,
Numpy 是庫。
var 是函式。
arr 是輸入陣列。
示例
在以下示例中,我們嘗試使用 numpy 的 var() 函式計算一維陣列的方差:
import numpy as np a = np.array([2,7,50,3,12]) print("The input array:",a) variance = np.var(a) print("The variance of the given input 1-d array:", variance)
輸出
The input array: [ 2 7 50 3 12] The variance of the given input 1-d array: 322.16
示例
讓我們再看一個使用 var() 函式計算二維陣列方差的示例。
import numpy as np a = np.array([[90,34],[43,23]]) print("The input array:",a) variance = np.var(a) print("The variance of the given input 2-d array:",variance)
輸出
The input array: [[90 34] [43 23]] The variance of the given input 2-d array: 652.25
標準差
標準差定義了資料與均值之間分佈的度量,並告訴我們資料與均值之間的偏差程度。此方法的數學公式如下。
Standard deviation = √(Σ(xi - x)2 / (n - 1))
其中,
n 是資料點的數量。
Σ(xi - x)2 是每個資料值與均值之間平方差的總和。
使用 Python 計算標準差
在 python 的 statistics 模組中,我們有名為 stdev() 的函式來查詢給定陣列的標準差。
示例
在以下示例中,我們嘗試透過將一維陣列傳遞給 stdev() 函式來計算陣列的標準差:
import statistics import numpy as np a = np.array([34,23,90,34,90,34,43,23]) print("The input array:",a) std = statistics.stdev(a) print("The standard deviation of the given input 1-d array:",std)
輸出
以下是為給定輸入陣列計算的標準差輸出。
The input array: [34 23 90 34 90 34 43 23] The standard deviation of the given input 1-d array: 27.694764848252458