Pandas 中的 series.corr() 方法是如何工作的?


pandas.Series.corr() 方法用於計算兩個 Series 物件之間的相關性,並排除缺失值。結果是一個介於 -1 到 1 之間的浮點值。如果輸出是整數 1,則表示兩個 Series 之間存在強正相關關係;如果輸出是“-1”,則表示存在強負相關關係。

series.corr() 方法有三個引數:第一個是另一個 Series 物件;第二個是相關方法的名稱;第三個是 min_period,這是一個可選引數。

示例 1

import pandas as pd

# create pandas Series1
series1 = pd.Series([9,2,4,6,1])

print("First series object:",series1)

# create pandas Series2
series2 = pd.Series([12,4,2,7,4])

print("Second series object:",series2)

# calculate the correlation
print("The Correlation value: ", series1.corr(series2, method='pearson'))

解釋

首先,我們使用 Python 整數列表建立了兩個 Pandas Series 物件。之後,我們使用“Pearson”方法找出這兩個 Series 物件的值之間的相關性。

輸出

First series object: 0 9
1 2
2 4
3 6
4 1
dtype: int64
Second series object: 0 12
1 4
2 2
3 7
4 4
dtype: int64
The Correlation value: 0.8471600336634684

以下示例中,兩個 Series 物件之間的相關性為“0.85”,這表明這兩個 Series 物件之間存在強正相關關係。

示例 2

import pandas as pd
import numpy as np
# create pandas Series1
series1 = pd.Series([12,np.nan,47,19,10])

print("First series object:",series1)

# create pandas Series2
series2 = pd.Series([9,4,2,np.nan,4])

print("Second series object:",series2)

# calculate the correlation
print("The Correlation value: ", series1.corr(series2, method='pearson'))

解釋

首先,我們使用 Python 整數列表建立了兩個 Pandas Series 物件,其中還包含一些由 numpy.nan 屬性建立的空值。之後,我們再次使用“Pearson”方法找出這兩個 Series 物件的值之間的相關性。

輸出

First series object:
0 12.0
1  NaN
2 47.0
3 19.0
4 10.0
dtype: float64

Second series object:
0 9.0
1 4.0
2 2.0
3 NaN
4 4.0
dtype: float64

The Correlation value: -0.6864226486537492

以下示例中,兩個 Series 物件之間的相關性為“-0.69”,這表明這兩個 Series 物件之間存在強負相關關係。

更新於:2022年3月9日

301 次瀏覽

啟動你的職業生涯

完成課程獲得認證

開始學習
廣告