在建立R資料框列的圖表時,如何處理警告訊息“Removed X rows containing missing values”?


如果我們的資料框中存在缺失值/NA,並且使用ggplot2建立圖表而不排除這些缺失值,那麼我們會收到警告“Removed X rows containing missing values”,其中X將是包含NA值的列的行數。但是圖表將是正確的,因為它將透過排除NA值來計算。為了避免此錯誤,我們只需要傳遞不包含NA值的資料框列的子集,如下例所示。

考慮一下y列包含一些NA值的資料框:

示例

 線上演示

set.seed(112)
x<-sample(0:10,25,replace=TRUE)
y<-sample(c(21:25,NA),25,replace=TRUE) df<-data.frame(x,y)
df

輸出

   x  y
1  4  21
2  10  NA
3  10  23
4  10 22
5  2  NA
6  1 NA
7  0 25
8  8 NA
9  1 22
10 4 23
11 2 21
12 3 23
13 9 25
14 6 25
15 7 21
16 10 24
17 6 NA
18 6 NA
19 8 NA
20 4 24
21 1 23
22 7 21
23 1 21
24 0 22
25 4 NA

載入ggplot2包併為df的x和y列建立點圖:

library(ggplot2) ggplot(df,aes(x,y))+geom_point()

警告訊息:

Removed 5 rows containing missing values (geom_point) -

在這裡,我們收到了關於缺失值的警告訊息。

圖表輸出

透過排除NA值來建立x和y的點圖:

示例

ggplot(data=subset(df,!is.na(y)),aes(x,y))+geom_point()

圖表的輸出與上面顯示的相同,但不會顯示警告訊息:

更新於:2020年10月16日

789 次瀏覽

開啟您的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.