如何在 R 資料框的一列中查詢唯一值?
分類變數有多個類別,但如果資料集很大,類別數量也很多,那麼識別它們就會變得有點困難。因此,我們可以提取分類變數的唯一值,這將有助於我們輕鬆識別分類變數的類別。我們可以透過對 R 資料框的每一列使用 unique 來實現這一點。
示例
考慮以下資料框 -
> x1<-rep(c("A","B","C","D"),each=5) > x2<-rep(c(5,10,15,20),times=c(2,8,6,4)) > x3<-rep(c("India","Russia","China","Indonesia","Iceland"),times=c(4,3,5,2,6)) > x4<-rep(c(letters[1:10]),times=2) > df<-data.frame(x1,x2,x3,x4) > df x1 x2 x3 x4 1 A 5 India a 2 A 5 India b 3 A 10 India c 4 A 10 India d 5 A 10 Russia e 6 B 10 Russia f 7 B 10 Russia g 8 B 10 China h 9 B 10 China i 10 B 10 China j 11 C 15 China a 12 C 15 China b 13 C 15 Indonesia c 14 C 15 Indonesia d 15 C 15 Iceland e 16 D 15 Iceland f 17 D 20 Iceland g 18 D 20 Iceland h 19 D 20 Iceland i 20 D 20 Iceland j
查詢 x1 列中的唯一值 -
> unique(df[c("x1")]) x1 1 A 6 B 11 C 16 D
查詢 x2 列中的唯一值 -
> unique(df[c("x2")]) x2 1 5 3 10 11 15 17 20
查詢 x3 列中的唯一值 -
> unique(df[c("x3")]) x3 1 India 5 Russia 8 China 13 Indonesia 15 Iceland
查詢 x4 列中的唯一值 -
> unique(df[c("x4")]) x4 1 a 2 b 3 c 4 d 5 e 6 f 7 g 8 h 9 i 10 j
廣告