演示Python中小提琴圖的工作原理?
如果我們希望比較類別中存在的資料,則可以使用箱線圖。這是一種利用分位數來了解資料集中資料分佈的方式。它由從箱體延伸出的垂直線組成。這些延伸部分稱為須線。這些須線說明了資料在上下四分位數之外的變化情況。這就是為什麼箱線圖也稱為須線圖的原因。資料中的異常值將作為單個點繪製。
小提琴圖是箱線圖與核密度估計 (KDE) 的組合。它更容易分析和理解資料的分佈方式。小提琴圖的寬部分表示資料密度較高。小提琴圖的窄部分表示資料密度較低。
箱線圖中的四分位數間距和資料的高密度部分在每個類別中都落在同一區域。
violinplot 函式的語法
seaborn.violinplot(x, y,data,…)
讓我們瞭解如何使用小提琴圖繪製資料:
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('tips') sb.violinplot(x = "day", y = "total_bill", data=my_df) plt.show()
輸出
解釋
- 匯入了所需的包。
- 輸入資料為“iris_data”,它從 scikit learn 庫載入。
- 此資料儲存在資料框中。
- 使用“load_dataset”函式載入 iris 資料。
- 使用“violinplot”函式視覺化此資料。
- 在此,資料框作為引數提供。
- 此外,還指定了 x 和 y 值。
- 此資料顯示在控制檯中。
廣告