如何根據提供的分組值子集R資料框?


子集是常用的技術之一,它根據分析目標具有多種不同的用途。如果找到提供的分組值之一,則子集資料框意味著如果分類變數值存在於分類列中,我們想要進行子集化,為此,我們可以按照以下步驟操作:

  • 建立資料框。
  • 如果存在分類變數的任何提供值,則對資料框進行子集化。

建立資料框

讓我們建立一個如下所示的資料框:

 線上演示

x<-rnorm(20,2)
Grp<-sample(LETTERS[1:4],20,replace=TRUE)
df<-data.frame(x,Grp)
df

執行上述指令碼後,將生成以下輸出(由於隨機化,此輸出會在您的系統上有所不同):

      x    Grp
1 0.3359965 A
2 2.0416162 A
3 0.9818926 A
4 1.4677398 D
5 1.5241767 B
6 1.3522920 A
7 0.1696135 D
8 2.8538156 C
9 1.5310543 C
10 3.8808002 A
11 1.6601963 C
12 0.7691347 A
13 -0.3206033 B
14 3.0502846 A
15 2.7044244 C
16 0.4451980 A
17 0.8252894 C
18 0.8465413 A
19 2.0163445 C
20 1.5913034 C

資料框子集

載入dplyr包,如果Grp列中存在A或C,則對df進行子集化:

library(dplyr)
x<-rnorm(20,2)
Grp<-sample(LETTERS[1:4],20,replace=TRUE)
df<-data.frame(x,Grp)
df %>% filter(Grp=="A"|Grp=="C")

輸出

      x    Grp
1 0.3359965 A
2 2.0416162 A
3 0.9818926 A
4 1.3522920 A
5 2.8538156 C
6 1.5310543 C
7 3.8808002 A
8 1.6601963 C
9 0.7691347 A
10 3.0502846 A
11 2.7044244 C
12 0.4451980 A
13 0.8252894 C
14 0.8465413 A
15 2.0163445 C
16 1.5913034 C

更新於:2021年8月13日

46 次檢視

啟動您的職業生涯

透過完成課程獲得認證

開始
廣告
© . All rights reserved.