如何根據提供的分組值子集R資料框?
子集是常用的技術之一,它根據分析目標具有多種不同的用途。如果找到提供的分組值之一,則子集資料框意味著如果分類變數值存在於分類列中,我們想要進行子集化,為此,我們可以按照以下步驟操作:
- 建立資料框。
- 如果存在分類變數的任何提供值,則對資料框進行子集化。
建立資料框
讓我們建立一個如下所示的資料框:
x<-rnorm(20,2) Grp<-sample(LETTERS[1:4],20,replace=TRUE) df<-data.frame(x,Grp) df
執行上述指令碼後,將生成以下輸出(由於隨機化,此輸出會在您的系統上有所不同):
x Grp 1 0.3359965 A 2 2.0416162 A 3 0.9818926 A 4 1.4677398 D 5 1.5241767 B 6 1.3522920 A 7 0.1696135 D 8 2.8538156 C 9 1.5310543 C 10 3.8808002 A 11 1.6601963 C 12 0.7691347 A 13 -0.3206033 B 14 3.0502846 A 15 2.7044244 C 16 0.4451980 A 17 0.8252894 C 18 0.8465413 A 19 2.0163445 C 20 1.5913034 C
資料框子集
載入dplyr包,如果Grp列中存在A或C,則對df進行子集化:
library(dplyr) x<-rnorm(20,2) Grp<-sample(LETTERS[1:4],20,replace=TRUE) df<-data.frame(x,Grp) df %>% filter(Grp=="A"|Grp=="C")
輸出
x Grp 1 0.3359965 A 2 2.0416162 A 3 0.9818926 A 4 1.3522920 A 5 2.8538156 C 6 1.5310543 C 7 3.8808002 A 8 1.6601963 C 9 0.7691347 A 10 3.0502846 A 11 2.7044244 C 12 0.4451980 A 13 0.8252894 C 14 0.8465413 A 15 2.0163445 C 16 1.5913034 C
廣告
資料結構
網路
關係型資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP