Pandas DataFrame 中兩個數字列之間的相關性


我們可以使用 pandas.DataFrame.corr 計算列的對相關性,排除空值。相關係數表示兩個變數之間線性關聯的強度。係數範圍為 -1 ~ 1。

要獲取 Pandas 資料框中兩個數字列之間的相關性,我們可以採取以下步驟 -

  • 設定圖形大小並調整子圖之間的和四周的填充。
  • 建立二維大小可變,潛在異構表格資料的 Pandas 資料框。
  • 比較兩列的值,並使用 col1.corr(col2) 計算相關係數。
  • 在控制檯上列印相關係數。
  • 若要顯示圖片,請使用 show() 方法。

示例

import pandas as pd
from matplotlib import pyplot as plt

plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True

df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})

col1 = df['lab']
col2 = df['value']

plt.plot(col1, col2)

print("The correlation coefficient is: ", col1.corr(col2))

plt.show()

輸出

將產生以下輸出

The correlation coefficient is: 1.0

在此,相關係數為 1.0,表示完全相關。因此,我們得到一條直線,因為所有點都位於一條直線上。

更新於: 21-Sep-2021

1K+ 瀏覽量

開始您的 職業

透過完成課程獲得認證

開始
廣告