如何在 Pandas 中使用 Series.cov() 方法查詢協方差?
Pandas 中的 Series.cov() 方法用於計算 Series 與其他 Series 的協方差,同時排除空值/NA 或缺失值。
協方差是一種計算兩個隨機變數之間關係的方法,它會告訴我們兩個隨機變數如何一起變化。
此 cov() 方法的輸出是一個浮點值,表示兩個 Series 之間的協方差。
此方法有三個引數,分別是 other、min_period 和 ddof。
示例 1
import pandas as pd
import numpy as np
# create pandas Series1
series1 = pd.Series([12,34,65,21])
print("First series object:",series1)
# create pandas Series2
series2 = pd.Series([9,78,62,12])
print("Second series object:",series2)
# calculate the covariance value
print("The covariance value: ", series1.cov(series2))解釋
我們使用整數列表初始化了兩個 Pandas Series 物件 series1 和 series2,然後透過應用 cov() 方法計算了協方差。
輸出
First series object: 0 12 1 34 2 65 3 21 dtype: int64 Second series object: 0 9 1 78 2 62 3 12 dtype: int64 The covariance value: 576.3333333333333
上面示例的協方差為 576.33,如上面輸出塊中所示。
示例 2
import pandas as pd
import numpy as np
# create pandas Series1
series1 = pd.Series([89,np.nan,74,91,100])
print("First series object:",series1)
# create pandas Series2
series2 = pd.Series([93,54,21,80,42])
print("Second series object:",series2)
# calculate the covariance value
print("The covariance value: ", series1.cov(series2, min_periods=3))解釋
在下面的示例中,我們計算了兩個 Series 物件之間的協方差,這裡給定 Series 物件的元素中存在 Nan 值。
輸出
First series object: 0 89.0 1 NaN 2 74.0 3 91.0 4 100.0 dtype: float64 Second series object: 0 93 1 54 2 21 3 80 4 42 dtype: int64 The covariance value: 141.66666666666666
series.cov() 方法在計算 Series 之間的協方差時會排除 Nan 值。對於上面的示例,協方差為“141.666”。
廣告
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP