如何在 Python Seaborn 中使用箱線圖比較不同類別的資料?


Seaborn 庫有助於資料視覺化。它帶有自定義主題和高階介面。

散點圖提供的資訊有限,因為它們只告訴我們給定資料類別中值的分佈情況。如果我們希望比較類別記憶體在的資料,我們需要使用不同的技術。這就是箱線圖發揮作用的地方。它是一種利用分位數來理解資料集中資料分佈的方法。

它由從箱體延伸出的垂直線組成。這些延伸部分稱為須線。這些須線描述了資料在上四分位數和下四分位數之外的變化情況。這就是為什麼箱線圖也稱為須線圖的原因。

箱線圖函式的語法

seaborn.boxplot(x, y,data,…)

資料中的異常值將作為單個點繪製。以下是一個示例:

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.boxplot(x = "species", y = "petal_length", data = my_df)
plt.show()

輸出

解釋

  • 匯入所需的包。
  • 輸入資料是“iris_data”,它從 scikit-learn 庫載入。
  • 此資料儲存在資料框中。
  • 使用“load_dataset”函式載入 iris 資料。
  • 使用“boxplot”函式視覺化此資料。
  • 在這裡,資料框作為引數提供。
  • 此外,還指定了 x 和 y 值。
  • 此資料顯示在控制檯中。

更新於:2020年12月11日

275 次瀏覽

啟動你的職業生涯

完成課程獲得認證

開始
廣告
© . All rights reserved.