如何在 R 中檢查資料框列是否包含重複值?
為了檢查資料框列是否包含重複的值,我們可以使用 duplicated 函式和 any 聯合使用。例如,如果我們有一個名為 df 的資料框,它包含一個列 ID,接著我們可以使用命令檢查 ID 是否包含重複值 −
any(duplicated(df$ID))
示例 1
考慮下面的資料框 −
ID<-1:20 x<-rpois(20,1) df1<-data.frame(ID,x) df1
輸出
ID x 1 1 4 2 2 1 3 3 2 4 4 2 5 5 1 6 6 0 7 7 1 8 8 1 9 9 0 10 10 1 11 11 1 12 12 2 13 13 1 14 14 3 15 15 1 16 16 0 17 17 0 18 18 3 19 19 2 20 20 2
檢查 x 是否包含任何重複資料 −
any(duplicated(df1$x))
[1] TRUE
示例 2
S.No<-1:20 y<-round(rnorm(20,5,3),1) df2<-data.frame(S.No,y) df2
輸出
S.No y 1 1 5.1 2 2 5.8 3 3 4.4 4 4 10.1 5 5 3.3 6 6 6.1 7 7 4.8 8 8 12.6 9 9 6.4 10 10 8.7 11 11 1.5 12 12 2.5 13 13 2.1 14 14 8.7 15 15 5.5 16 16 2.0 17 17 2.1 18 18 5.5 19 19 5.4 20 20 3.4
檢查 y 是否包含任何重複資料 −
any(duplicated(df2$y))
[1] TRUE
廣告
資料結構
網路
RDBMS
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP