如何針對資料幀中列的某些元素替換字串中的空格?
多數情況下,字串的資料格式不佳,我們需要進行適當的處理以方便後續分析。有時字串列中會有一些值使用多餘的空格,這並不必要,從而導致其與其他列值不匹配。為了移除這些空格,我們可以使用 `lapply` 和 `gsub` 函式。
示例
考慮以下資料幀 −
x1<-rep(c("A 1","A2","A 3","A4","A5"),times=4) x2<-rep(c("#1","# 2","#3","#4"),each=5) x3<-rep(c(5,7,8,12,15,18,22,24,31,39),times=2) df<-data.frame(x1,x2,x3) df x1 x2 x3 1 A1 #1 5 2 A2 #1 7 3 A3 #1 8 4 A4 #1 12 5 A5 #1 15 6 A1 #2 18 7 A2 #2 22 8 A3 #2 24 9 A4 #2 31 10 A5 #2 39 11 A1 #3 5 12 A2 #3 7 13 A3 #3 8 14 A4 #3 12 15 A5 #3 15 16 A1 #4 18 17 A2 #4 22 18 A3 #4 24 19 A4 #4 31 20 A5 #4 39
僅替換第 2 列中的空格 −
df[-c(1,3)] <- lapply(df[-c(1,3)], gsub, pattern = " ", replacement = "", fixed = TRUE) df x1 x2 x3 1 A1 #1 5 2 A2 #1 7 3 A3 #1 8 4 A4 #1 12 5 A5 #1 15 6 A1 #2 18 7 A2 #2 22 8 A3 #2 24 9 A4 #2 31 10 A5 #2 39 11 A1 #3 5 12 A2 #3 7 13 A3 #3 8 14 A4 #3 12 15 A5 #3 15 16 A1 #4 18 17 A2 #4 22 18 A3 #4 24 19 A4 #4 31 20 A5 #4 39
替換所有列中的空格 −
df[] <- lapply(df, gsub, pattern = " ", replacement = "", fixed = TRUE) df x1 x2 x3 1 A1 #1 5 2 A2 #1 7 3 A3 #1 8 4 A4 #1 12 5 A5 #1 15 6 A1 #2 18 7 A2 #2 22 8 A3 #2 24 9 A4 #2 31 10 A5 #2 39 11 A1 #3 5 12 A2 #3 7 13 A3 #3 8 14 A4 #3 12 15 A5 #3 15 16 A1 #4 18 17 A2 #4 22 18 A3 #4 24 19 A4 #4 31 20 A5 #4 39
廣告