如何在 R 資料框列中提取不重複的值？

通常，重複值是在第一次出現後才被考慮，但值的第一次出現也是其餘重複值的副本。因此，我們可能也希望將其排除。

藉助 `duplicated` 函式和否定運算子，可以輕鬆地從 R 資料框列中提取不重複的值，如下面的示例所示。

示例 1

以下程式碼片段建立了一個示例資料框：

x<-rpois(20,10)
df1<-data.frame(x)
df1

建立了以下資料框

為了從上面建立的資料框的 x 中提取不包含第一次重複的不重複值，請將以下程式碼新增到上面的程式碼片段中：

x<-rpois(20,10)
df1<-data.frame(x)
df1$x[!(duplicated(df1$x)|duplicated(df1$x,fromLast=TRUE))]

如果您將以上所有程式碼片段作為單個程式執行，則會生成以下輸出：

[1] 5 17 6 14 13 15 4 9

以下程式碼片段建立了一個示例資料框：

y<-sample(1:10,20,replace=TRUE)
df2<-data.frame(y)
df2

建立了以下資料框

為了從上面建立的資料框的 y 中提取不包含第一次重複的不重複值，請將以下程式碼新增到上面的程式碼片段中：

y<-sample(1:10,20,replace=TRUE)
df2<-data.frame(y)
df2
df2$y[!(duplicated(df2$y)|duplicated(df2$y,fromLast=TRUE))]

如果您將以上所有程式碼片段作為單個程式執行，則會生成以下輸出：

[1] 8 4

以下程式碼片段建立了一個示例資料框：

z<-sample(501:510,20,replace=TRUE)
df3<-data.frame(z)
df3

建立了以下資料框

為了從上面建立的資料框的 y 中提取不包含第一次重複的不重複值，請將以下程式碼新增到上面的程式碼片段中：

z<-sample(501:510,20,replace=TRUE)
df3<-data.frame(z)
df3$z[!(duplicated(df3$z)|duplicated(df3$z,fromLast=TRUE))]

如果您將以上所有程式碼片段作為單個程式執行，則會生成以下輸出：

[1] 509 504 503

Nizamuddin Siddiqui

更新於：2021年11月1日

1K+ 次瀏覽

完成課程獲得認證