Python中的相關性和迴歸


相關性是指涉及兩個資料集之間依賴性的某些統計關係。線性迴歸是一種線性方法,用於建立因變數和一個或多個自變數之間的關係。單個自變數稱為線性迴歸,而多個自變數稱為多元迴歸。

相關性

依賴現象的簡單例子包括父母的體貌特徵與其子女之間的相關性,以及產品的價格與其供應數量之間的相關性。我們以seaborn Python庫中提供的鳶尾花資料集為例。我們嘗試建立三種鳶尾花物種的花萼和花瓣的長度和寬度之間的相關性。根據發現的相關性,可以建立一個強大的模型,輕鬆區分一個物種與另一個物種。

示例

import matplotlib.pyplot as plt
import seaborn as sns
df = sns.load_dataset('iris')
#without regression
sns.pairplot(df, kind="scatter")
plt.show()

輸出

執行上述程式碼得到以下結果:

線性迴歸

在數學上,線性關係在繪製成圖表時表示一條直線。非線性關係中,任何變數的指數都不等於1,會產生曲線。Seaborn中用於查詢線性迴歸關係的函式是regplot。下面的例子展示了它的用法。

示例

import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
sb.regplot(x = "total_bill", y = "tip", data = df)
plt.show()

輸出

執行上述程式碼得到以下結果:

更新於:2020年7月9日

3K+ 次瀏覽

啟動您的職業生涯

透過完成課程獲得認證

開始
廣告
© . All rights reserved.