如何在 R 中檢測 data.table 物件中的重複項?
只需藉助 delta($)運算子(它用於訪問行和 duplicated 函式),即可輕鬆檢查 data.table 物件中的重複項。例如,如果 data.table 物件 DT 包含一個名為 x 的列,那麼,要檢查 x 中的重複項,我們可以使用命令 duplicated(DT$x)。
示例 1
載入 data.table 物件並建立一個物件 −
library(data.table) set.seed(141) x<−rpois(20,5) DT1<−data.table(x) DT1
輸出
x 1: 6 2: 3 3: 5 4: 5 5: 5 6: 5 7: 3 8: 4 9: 6 10: 7 11: 3 12: 4 13: 3 14: 5 15: 4 16: 6 17: 6 18: 4 19: 4 20: 10
檢查 x 中的重複項 −
示例
duplicated(DT1$x)
輸出
[1] FALSE FALSE FALSE TRUE TRUE TRUE TRUE FALSE TRUE FALSE TRUE TRUE [13] TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE
示例 2
y<−round(rnorm(20,5,2),0) DT2<−data.table(y) DT2
輸出
y 1: 4 2: 3 3: 8 4: 9 5: 4 6: 4 7: 6 8: 5 9: 3 10: 5 11: 3 12: 5 13: 9 14: 8 15: 6 16: 4 17: 2 18: 6 19: 4 20: 5
檢查 y 中的重複項 −
示例
duplicated(DT2$y)
輸出
[1] FALSE FALSE FALSE FALSE TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE [13] TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE
示例 3
z<−round(runif(20,2,5),0) DT3<−data.table(z) DT3
輸出
z 1: 4 2: 2 3: 2 4: 4 5: 4 6: 4 7: 4 8: 4 9: 3 10: 3 11: 5 12: 5 13: 2 14: 2 15: 4 16: 5 17: 3 18: 3 19: 2 20: 5
檢查 z 中的重複項 −
示例
duplicated(DT3$z)
輸出
[1] FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE FALSE TRUE [13] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
廣告
資料結構
網路
RDBMS
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP