如何在R中選擇資料框中不存在於另一個數據框中的行？

有時我們需要查詢兩個資料框之間不相同的行，而不是查詢公共行。當我們預期不相同的行數很多而不是很少時，這通常很有用。我們可以使用否定運算子（用感嘆號表示）和子集函式來做到這一點。

示例

考慮以下資料框：

> x1<-sample(1:10,20,replace=TRUE)
> y1<-sample(1:10,20,replace=TRUE)
> df1<-data.frame(x1,y1)
> df1

> x2<-sample(1:10,20,replace=TRUE)
> y2<-sample(1:10,20,replace=TRUE)
> df2<-data.frame(x2,y2)
> df2

現在假設我們想要獲取df2變數y2的一個子集，這些子集不存在於df1的y1中，那麼可以按如下方式進行：

> subset(df2,!(y2%in%df1$y1))
x2 y2
16 1 7
<0 rows> (or 0-length row.names)

類似地，獲取df2變數y2的一個子集，這些子集不存在於df1的x1中，那麼可以按如下方式進行：

> subset(df2,!(y2%in%df1$x1))
[1] x2 y2
<0 rows> (or 0-length row.names)

讓我們再看一個例子：

> x1<-rep(1:10,2)
> df1<-data.frame(x1)
> df1

> x2<-rep(1:5,4)
> df2<-data.frame(x2)
> df2

> subset(df1,!(x1%in%df2$x2))

Nizamuddin Siddiqui

更新於：2020年9月4日

2K+瀏覽量

透過完成課程獲得認證