如何在R資料框中查詢重複行計數(如果大於n)?
要查詢R資料框中重複行的計數(如果大於n),我們可以按照以下步驟操作:
- 首先,建立一個數據框。
- 然後,使用dplyr包的`group_by_all`、`count`和`filter`函式來統計重複行,如果它們大於某個數字。
建立資料框
讓我們建立一個如下所示的資料框:
x<-rpois(30,1) y<-rpois(30,1) df<-data.frame(x,y) df
執行上述指令碼後,將生成以下輸出(由於隨機化,此輸出將在您的系統上有所不同):
x y 1 1 3 2 0 2 3 0 2 4 0 2 5 2 1 6 1 0 7 0 0 8 1 2 9 1 2 10 2 1 11 0 3 12 1 1 13 1 1 14 0 0 15 0 0 16 0 1 17 0 0 18 0 1 19 0 1 20 2 0 21 1 2 22 3 1 23 1 0 24 1 0 25 1 3 26 1 0 27 1 1 28 2 1 29 1 2 30 0 4
如果重複行數大於某個數字,則統計重複行數
載入dplyr包,並使用`group_by_all`、`count`和`filter`函式來查詢如果重複行數大於2的重複行計數:
x<-rpois(30,1) y<-rpois(30,1) df<-data.frame(x,y) library(dplyr) df%>%group_by_all()%>%count()%>%filter(n>2)
輸出
# A tibble: 7 x 3 # Groups: x, y [7] x y n <int> <int> <int> 1 0 0 4 2 0 1 3 3 0 2 3 4 1 0 4 5 1 1 3 6 1 2 4 7 2 1 3
廣告
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP