Pandas 中的 series.corr() 方法是如何工作的?
pandas.Series.corr() 方法用於計算兩個 Series 物件之間的相關性,並排除缺失值。結果是一個介於 -1 到 1 之間的浮點值。如果輸出是整數 1,則表示兩個 Series 之間存在強正相關關係;如果輸出是“-1”,則表示存在強負相關關係。
series.corr() 方法有三個引數:第一個是另一個 Series 物件;第二個是相關方法的名稱;第三個是 min_period,這是一個可選引數。
示例 1
import pandas as pd # create pandas Series1 series1 = pd.Series([9,2,4,6,1]) print("First series object:",series1) # create pandas Series2 series2 = pd.Series([12,4,2,7,4]) print("Second series object:",series2) # calculate the correlation print("The Correlation value: ", series1.corr(series2, method='pearson'))
解釋
首先,我們使用 Python 整數列表建立了兩個 Pandas Series 物件。之後,我們使用“Pearson”方法找出這兩個 Series 物件的值之間的相關性。
輸出
First series object: 0 9 1 2 2 4 3 6 4 1 dtype: int64 Second series object: 0 12 1 4 2 2 3 7 4 4 dtype: int64 The Correlation value: 0.8471600336634684
以下示例中,兩個 Series 物件之間的相關性為“0.85”,這表明這兩個 Series 物件之間存在強正相關關係。
示例 2
import pandas as pd import numpy as np # create pandas Series1 series1 = pd.Series([12,np.nan,47,19,10]) print("First series object:",series1) # create pandas Series2 series2 = pd.Series([9,4,2,np.nan,4]) print("Second series object:",series2) # calculate the correlation print("The Correlation value: ", series1.corr(series2, method='pearson'))
解釋
首先,我們使用 Python 整數列表建立了兩個 Pandas Series 物件,其中還包含一些由 numpy.nan 屬性建立的空值。之後,我們再次使用“Pearson”方法找出這兩個 Series 物件的值之間的相關性。
輸出
First series object: 0 12.0 1 NaN 2 47.0 3 19.0 4 10.0 dtype: float64 Second series object: 0 9.0 1 4.0 2 2.0 3 NaN 4 4.0 dtype: float64 The Correlation value: -0.6864226486537492
以下示例中,兩個 Series 物件之間的相關性為“-0.69”,這表明這兩個 Series 物件之間存在強負相關關係。
廣告