在 Python 的 Seaborn 庫中使用 stripplot 建立分類散點圖時，如何避免資料點重疊？

資料視覺化是一個重要步驟，因為它有助於理解資料中的情況，而無需檢視數字並執行復雜的計算。Seaborn 是一個有助於資料視覺化的庫。它帶有自定義主題和高階介面。

當需要處理的變數本質上是分類變數時，不能使用一般的散點圖、直方圖等。這時需要使用分類散點圖。

諸如“stripplot”、“swarmplot”之類的繪圖用於處理分類變數。“stripplot”函式用於至少一個變數是分類變數的情況。資料沿一個軸以排序的方式表示。但缺點是某些點會重疊。這就是需要使用“jitter”引數來避免變數之間重疊的地方。

它向資料集新增一些隨機噪聲，並調整分類軸上值的位。

stripplot 函式的語法

seaborn.stripplot(x, y,data, jitter = …)

讓我們看看如何使用“jitter”引數在資料集中繪製分類變數：

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True)
plt.show()

輸出

解釋

匯入所需的包。
輸入資料是“iris_data”，它從 scikit-learn 庫載入。
此資料儲存在資料框中。
“load_dataset”函式用於載入 iris 資料。
使用“stripplot”函式視覺化此資料。
傳遞一個名為“jitter”的附加引數以避免資料框值的重疊。
此處，資料框作為引數提供。
此外，還指定了 x 和 y 值。
此資料顯示在控制檯中。

AmitDiwan

更新於：2020年12月11日

1K+ 次檢視

啟動您的職業生涯

完成課程後獲得認證

開始學習

在 Python 的 Seaborn 庫中使用 stripplot 建立分類散點圖時，如何避免資料點重疊？

示例

輸出

解釋

啟動您的 職業生涯

啟動您的職業生涯