如何在 R 資料框的一列中查詢唯一值?


分類變數有多個類別,但如果資料集很大,類別數量也很多,那麼識別它們就會變得有點困難。因此,我們可以提取分類變數的唯一值,這將有助於我們輕鬆識別分類變數的類別。我們可以透過對 R 資料框的每一列使用 unique 來實現這一點。

示例

考慮以下資料框 -

> x1<-rep(c("A","B","C","D"),each=5)
> x2<-rep(c(5,10,15,20),times=c(2,8,6,4))
> x3<-rep(c("India","Russia","China","Indonesia","Iceland"),times=c(4,3,5,2,6))
> x4<-rep(c(letters[1:10]),times=2)
> df<-data.frame(x1,x2,x3,x4)
> df
   x1 x2  x3     x4
1  A  5 India     a
2  A  5 India     b
3  A 10 India     c
4  A 10 India     d
5  A 10 Russia    e
6  B 10 Russia    f
7  B 10 Russia    g
8  B 10 China     h
9  B 10 China     i
10 B 10 China     j
11 C 15 China     a
12 C 15 China     b
13 C 15 Indonesia c
14 C 15 Indonesia d
15 C 15 Iceland   e
16 D 15 Iceland   f
17 D 20 Iceland   g
18 D 20 Iceland   h
19 D 20 Iceland   i
20 D 20 Iceland   j

查詢 x1 列中的唯一值 -

> unique(df[c("x1")])
x1
1 A
6 B
11 C
16 D

查詢 x2 列中的唯一值 -

> unique(df[c("x2")])
x2
1 5
3 10
11 15
17 20

查詢 x3 列中的唯一值 -

> unique(df[c("x3")])
x3
1 India
5 Russia
8 China
13 Indonesia
15 Iceland

查詢 x4 列中的唯一值 -

> unique(df[c("x4")])
x4
1 a
2 b
3 c
4 d
5 e
6 f
7 g
8 h
9 i
10 j

更新於: 2020年8月11日

11K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告