如果其中一個變數是 Python 中的離散值,如何使用“implot”函式將值擬合到資料?


構建迴歸模型時,會檢查多重共線性。這是因為我們需要了解所有不同連續變數組合之間的相關性。如果變數之間存在多重共線性,我們必須確保將其從資料中移除。

這就是“regpot”和“implot”函式發揮作用的地方。它們有助於視覺化線性迴歸中變數之間的線性關係。

“regplot”函式接受各種格式的變數“x”和“y”的值,包括 numpy 陣列、pandas 系列物件、對 pandas 資料框中變數或值的引用。

另一方面,“implot”函式要求使用者為資料傳遞特定引數,並且變數“x”和“y”的值需要是字串。這種資料格式稱為長格式資料。這是一個示例:

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('tips')
sb.lmplot(x = "size", y = "tip", data = my_df)
plt.show()

輸出

解釋

  • 匯入所需的包。
  • 輸入資料是“tips”,它從 seaborn 庫載入。
  • 此資料儲存在資料框中。
  • 使用“load_dataset”函式載入 iris 資料。
  • 使用“implot”函式視覺化此資料。
  • 在此,資料框作為引數提供。
  • 此外,還指定了 x 和 y 值。
  • 此資料顯示在控制檯上。

更新於:2020年12月11日

瀏覽量 151 次

開啟您的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.