如何在 Pandas 中使用 Series.cov() 方法查詢協方差?


Pandas 中的 Series.cov() 方法用於計算 Series 與其他 Series 的協方差,同時排除空值/NA 或缺失值。

協方差是一種計算兩個隨機變數之間關係的方法,它會告訴我們兩個隨機變數如何一起變化。

此 cov() 方法的輸出是一個浮點值,表示兩個 Series 之間的協方差。

此方法有三個引數,分別是 other、min_period 和 ddof。

示例 1

import pandas as pd
import numpy as np
# create pandas Series1
series1 = pd.Series([12,34,65,21])

print("First series object:",series1)

# create pandas Series2
series2 = pd.Series([9,78,62,12])

print("Second series object:",series2)

# calculate the covariance value
print("The covariance value: ", series1.cov(series2))

解釋

我們使用整數列表初始化了兩個 Pandas Series 物件 series1 和 series2,然後透過應用 cov() 方法計算了協方差。

輸出

First series object:
0 12
1 34
2 65
3 21
dtype: int64

Second series object:
0  9
1 78
2 62
3 12
dtype: int64

The covariance value: 576.3333333333333

上面示例的協方差為 576.33,如上面輸出塊中所示。

示例 2

import pandas as pd
import numpy as np

# create pandas Series1
series1 = pd.Series([89,np.nan,74,91,100])

print("First series object:",series1)

# create pandas Series2
series2 = pd.Series([93,54,21,80,42])

print("Second series object:",series2)

# calculate the covariance value
print("The covariance value: ", series1.cov(series2, min_periods=3))

解釋

在下面的示例中,我們計算了兩個 Series 物件之間的協方差,這裡給定 Series 物件的元素中存在 Nan 值。

輸出

First series object:
0 89.0
1  NaN
2 74.0
3 91.0
4 100.0
dtype: float64

Second series object: 0 93
1 54
2 21
3 80
4 42
dtype: int64

The covariance value: 141.66666666666666

series.cov() 方法在計算 Series 之間的協方差時會排除 Nan 值。對於上面的示例,協方差為“141.666”。

更新於: 2022年3月9日

2K+ 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.