Python 箱線圖



箱線圖是衡量資料集內資料分佈程度的一種方法。它將資料集分為三個四分位數。該圖表表示資料集中的最小值、最大值、中位數、第一四分位數和第三四分位數。它也用於透過繪製每個資料集的箱線圖來比較不同資料集的資料分佈。

繪製箱線圖

可以透過呼叫 Series.box.plot() 和 DataFrame.box.plot(),或者 DataFrame.boxplot() 來繪製箱線圖,以視覺化每一列中值的分佈。

例如,這是一個表示對[0,1)上的均勻隨機變數進行10次觀測的五次試驗的箱線圖。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')
 

其**輸出**如下:

boxplot.png
廣告
© . All rights reserved.