如何在R資料框列中檢查特定單詞是否存在?


如果我們在R資料框中有一個字元列,我們可能需要檢查特定值是否存在於該列中。例如,如果我們有一個性別列,我們可能需要檢查“跨性別者”是否存在於該列中。這可以使用`grepl`函式來實現。檢視下面的示例以瞭解其工作原理。

考慮以下資料框:

示例

 線上演示

x<-sample(c("Mazda","Merc","Fiat"),20,replace=TRUE)
df1<-data.frame(x)
df1

輸出

   x
1  Fiat
2  Merc
3  Fiat
4  Merc
5  Merc
6  Fiat
7  Fiat
8  Fiat
9  Mazda
10 Fiat
11 Mazda
12 Mazda
13 Fiat
14 Fiat
15 Mazda
16 Mazda
17 Merc
18 Merc
19 Mazda
20 Merc

檢查“Merc”是否在df1的x列中存在:

示例

grepl("Merc",df1$x)

輸出

[1]  FALSE TRUE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE TRUE TRUE FALSE TRUE

示例

 線上演示

y<-sample(c("Hotel","Motel","Restaurant"),20,replace=TRUE)
df2<-data.frame(y)
df2

輸出

   y
1  Motel
2  Hotel
3  Motel
4  Motel
5  Hotel
6  Hotel
7  Motel
8  Motel
9  Hotel
10 Hotel
11 Restaurant
12 Restaurant
13 Motel
14 Hotel
15 Motel
16 Hotel
17 Hotel
18 Restaurant
19 Hotel
20 Hotel

檢查“Motel”是否在df2的y列中存在:

示例

grepl("Motel",df2$y)

輸出

[1] TRUE FALSE TRUE TRUE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE
[13] TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE

更新於:2021年2月10日

705 次瀏覽

啟動你的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.