Python 統計模組



Python 的Statistics 模組提供用於計算數學上真實資料的函式。Python 有一個內建模組;此函式支援 int、float、decimal 和 fractional。

如果您的輸入資料包含混合資料型別,那麼我們可以使用 map (float, input_data) 來確保一致的結果。

一些資料集使用 NaN(非數字)來表示缺失資料。NaN 具有不尋常的比較語義;它們會導致統計函式中令人驚訝或未定義的行為,這些函式對資料進行排序以計數出現次數。

平均值和集中趨勢度量

這些函式從總體或樣本中計算平均值或典型值。

序號 函式 & 描述
1

mean()

資料的算術平均值(“平均值”)。

2

fmean()

浮點算術平均值,可選加權。

3

geometric_mean()

資料的幾何平均值。

4

harmonic_mean()

資料的調和平均值。

5

median()

資料的中間值(中間值)。

6

median_low()

資料的低中間值。

7

median_high()

資料的高中間值。

8

median_grouped()

分組資料的中間值(第 50 個百分位數)。

9

mode()

離散或名義資料的單個眾數(最常見的值)。

10

multimode()

離散或名義資料的眾數列表(最常見的值)。

11

quantiles()

將資料劃分為機率相等的區間。

離散程度的度量

這些函式計算總體或樣本偏離典型值或平均值的程度的度量。

序號 模組 & 描述
1

pstdev()

資料的總體標準差。

2

pvariance()

資料的總體方差。

3

stdev()

資料的樣本標準差。

4

variance()

資料的樣本方差。

兩個輸入之間關係的統計資料

這些函式計算關於兩個輸入之間關係的統計資料。

序號 模組 & 描述
1

covariance()

兩個變數的樣本協方差。

2

correlation()

皮爾遜相關係數 r 的取值範圍為 -1 到 +1。

3

linear_regression()

簡單線性迴歸的斜率和截距。

注意

這些函式不需要給定的資料進行排序。

python_modules.htm
廣告

© . All rights reserved.