如何在 Python 中擬合多項式迴歸模型來理解資料中的非線性趨勢?
在構建迴歸模型時,會檢查多重共線性。這是因為我們需要了解所有不同連續變數組合之間存在的相關性。如果變數之間存在多重共線性,我們必須確保將其從資料中移除。
現實世界中的資料通常是非線性的。我們需要找到機制來將此類非線性資料擬合到模型中。我們將使用 Anscombe 的資料集來視覺化此資料。
‘implot’ 函式用於非線性資料 -
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('anscombe') sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3) plt.show()
輸出
解釋
- 匯入所需的包。
- 輸入資料是 ‘anscombe’,它從 seaborn 庫載入。
- 此資料儲存在資料框中。
- ‘load_dataset’ 函式用於載入 iris 資料。
- 使用 ‘implot’ 函式視覺化此資料。
- 在此,資料框作為引數提供。
- 此外,還指定了 x 值、y 值和階數。
- 此資料顯示在控制檯上。
廣告