如何在R資料框中查詢重複行計數(如果大於n)?


要查詢R資料框中重複行的計數(如果大於n),我們可以按照以下步驟操作:

  • 首先,建立一個數據框。
  • 然後,使用dplyr包的`group_by_all`、`count`和`filter`函式來統計重複行,如果它們大於某個數字。

建立資料框

讓我們建立一個如下所示的資料框:

 線上演示

x<-rpois(30,1)
y<-rpois(30,1)
df<-data.frame(x,y)
df

執行上述指令碼後,將生成以下輸出(由於隨機化,此輸出將在您的系統上有所不同):

  x y
1 1 3
2 0 2
3 0 2
4 0 2
5 2 1
6 1 0
7 0 0
8 1 2
9 1 2
10 2 1
11 0 3
12 1 1
13 1 1
14 0 0
15 0 0
16 0 1
17 0 0
18 0 1
19 0 1
20 2 0
21 1 2
22 3 1
23 1 0
24 1 0
25 1 3
26 1 0
27 1 1
28 2 1
29 1 2
30 0 4

如果重複行數大於某個數字,則統計重複行數

載入dplyr包,並使用`group_by_all`、`count`和`filter`函式來查詢如果重複行數大於2的重複行計數:

x<-rpois(30,1)
y<-rpois(30,1)
df<-data.frame(x,y)
library(dplyr)
df%>%group_by_all()%>%count()%>%filter(n>2)

輸出

# A tibble: 7 x 3
# Groups: x, y [7]
     x     y     n
  <int> <int> <int>
1    0    0    4
2    0    1    3
3    0    2    3
4    1    0    4
5    1    1    3
6    1    2    4
7    2    1    3

更新於:2021年8月14日

410 次瀏覽

啟動您的職業生涯

透過完成課程獲得認證

開始
廣告
© . All rights reserved.