計算給定 NumPy 陣列的均值、標準差和方差


均值、標準差和方差是用於描述給定資料集資料分佈的統計量度。在 Numpy 庫中,我們有函式可以計算陣列的均值、標準差和方差。讓我們逐一詳細瞭解。

均值

均值也稱為平均值,它是陣列中所有元素的總和除以元素總數。它用於表示資料的集中趨勢。

語法

以下是將均值函式應用於陣列的語法:

numpy.mean(arr)

其中

  • Numpy 是庫。

  • mean 是函式。

  • arr 是輸入陣列。

示例

在以下示例中,我們使用mean()函式計算給定輸入一維陣列的均值。

import numpy as np
a = np.array([22,1,7,14,5,2])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input array:",mean_array)

輸出

以下是給定輸入陣列的均值輸出。

The input array: [22 1 7 14 5 2]
The mean of the given input array: 8.5

示例

讓我們再看一個使用 NumPy 陣列的 mean() 函式計算二維陣列均值的示例。

import numpy as np
a = np.array([[34,23],[90,34],[43,23],[10,34]])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input 2-d array:",mean_array)

輸出

以下是執行程式碼時上述程式碼的輸出:

The input array: [[34 23]
 [90 34]
 [43 23]
 [10 34]]
The mean of the given input 2-d array: 36.375

示例

在這裡,我們使用 NumPy 陣列的 mean() 函式計算三維陣列的均值。

import numpy as np
a = np.array([[[34,23],[90,34]],[[43,23],[10,34]]])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input 3-d array:",mean_array)

輸出

The input array: [[[34 23]
  [90 34]]

 [[43 23]
  [10 34]]]
The mean of the given input 3-d array: 36.375

方差

這用於查詢資料在給定資料集中是如何分佈的。它是透過計算每個資料點與其均值平方差的平均值來計算的。從數學上講,查詢方差的公式如下所示。

Variance = (1/n) * sum((xi - mean)2)

其中,

  • n 是資料點的數量。

  • xi 是給定資料的第 i 個數據點。

  • mean 是給定資料的平均值

  • 高方差

高方差

高方差表示資料值分佈在較大的範圍內,而低方差表示值聚集在資料值的均值周圍。在 Numpy 中,我們有 var() 函式來計算給定陣列的方差。

語法

以下是將方差函式用於陣列的語法。

numpy.var(arr)

其中,

  • Numpy 是庫。

  • var 是函式。

  • arr 是輸入陣列。

示例

在以下示例中,我們嘗試使用 numpy 的 var() 函式計算一維陣列的方差:

import numpy as np
a = np.array([2,7,50,3,12])
print("The input array:",a)
variance = np.var(a)
print("The variance of the given input 1-d array:", variance)

輸出

The input array: [ 2  7 50  3 12]
The variance of the given input 1-d array: 322.16

示例

讓我們再看一個使用 var() 函式計算二維陣列方差的示例。

import numpy as np
a = np.array([[90,34],[43,23]])
print("The input array:",a)
variance = np.var(a)
print("The variance of the given input 2-d array:",variance)

輸出

The input array: [[90 34]
 [43 23]]
The variance of the given input 2-d array: 652.25

標準差

標準差定義了資料與均值之間分佈的度量,並告訴我們資料與均值之間的偏差程度。此方法的數學公式如下。

Standard deviation = √(Σ(xi - x)2 / (n - 1))

其中,

  • n 是資料點的數量。

  • Σ(xi - x)2 是每個資料值與均值之間平方差的總和。

使用 Python 計算標準差

在 python 的 statistics 模組中,我們有名為 stdev() 的函式來查詢給定陣列的標準差。

示例

在以下示例中,我們嘗試透過將一維陣列傳遞給 stdev() 函式來計算陣列的標準差:

import statistics
import numpy as np
a = np.array([34,23,90,34,90,34,43,23])
print("The input array:",a)
std = statistics.stdev(a)
print("The standard deviation of the given input 1-d array:",std)

輸出

以下是為給定輸入陣列計算的標準差輸出。

The input array: [34 23 90 34 90 34 43 23]
The standard deviation of the given input 1-d array: 27.694764848252458

更新於:2023 年 8 月 7 日

327 次檢視

啟動您的 職業生涯

透過完成課程獲得認證

開始
廣告