如何從 R 中的箱線圖中提取離群值?


若要提取箱線圖的離群值,可將 out 函式與 boxplot 函式搭配使用。例如,如果我們有一個名為 X 的向量其中包含一些離群值,則可透過使用以下提供的命令提取這些離群值 −

boxplot(df$X,plot=FALSE)$out

該命令不會建立繪圖,因為 plot 已設定為 FALSE。

示例

以下程式碼段建立一個樣本資料幀 −

df=data.frame(x=rlnorm(25))
df

建立以下資料幀 −

     x
1  0.5699270
2  3.5812629
3  0.3507882
4  0.1400328
5  0.7239948
6  2.5494114
7  3.1243611
8  5.3207739
9  0.1672539
10 7.6235529
11 0.4950263
12 1.1713592
13 1.6590328
14 0.4404338
15 0.1354914
16 0.6192213
17 1.0878246
18 0.4084088
19 0.3980110
20 1.3915935
21 0.8679156
22 1.5447279
23 0.9476949
24 0.4036890
25 3.6822067

若要建立 x 的箱線圖,請在上述程式碼段中新增以下程式碼 −

df=data.frame(x=rlnorm(25))
boxplot(df$x)

輸出

如果執行所有上述程式碼段作為單個程式,將生成以下輸出: −

若要從上述箱線圖中提取離群值,請在上述程式碼段中新增以下程式碼 −

df=data.frame(x=rlnorm(25))
boxplot(df$x,plot=FALSE)$out

輸出

如果執行所有上述程式碼段作為單個程式,將生成以下輸出: −

[1] 3.581263 5.320774 7.623553 3.682207

更新於: 11-11-2021

2K+ 瀏覽量

啟動你的事業

完成課程,獲得認證

開始
廣告
© . All rights reserved.