Pandas DataFrame 中兩個數字列之間的相關性
我們可以使用 pandas.DataFrame.corr 計算列的對相關性,排除空值。相關係數表示兩個變數之間線性關聯的強度。係數範圍為 -1 ~ 1。
要獲取 Pandas 資料框中兩個數字列之間的相關性,我們可以採取以下步驟 -
- 設定圖形大小並調整子圖之間的和四周的填充。
- 建立二維大小可變,潛在異構表格資料的 Pandas 資料框。
- 比較兩列的值,並使用 col1.corr(col2) 計算相關係數。
- 在控制檯上列印相關係數。
- 若要顯示圖片,請使用 show() 方法。
示例
import pandas as pd from matplotlib import pyplot as plt plt.rcParams["figure.figsize"] = [7.00, 3.50] plt.rcParams["figure.autolayout"] = True df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]}) col1 = df['lab'] col2 = df['value'] plt.plot(col1, col2) print("The correlation coefficient is: ", col1.corr(col2)) plt.show()
輸出
將產生以下輸出
The correlation coefficient is: 1.0
在此,相關係數為 1.0,表示完全相關。因此,我們得到一條直線,因為所有點都位於一條直線上。
廣告