如何在R資料框列中刪除連續重複的重複項？

通常情況下，重複的值會導致資料中出現重複，如果這些值不太可能對分析結果造成偏差，我們可能希望去除這些值。例如，如果我們有一列定義了一個過程，我們對該過程進行了五次輸出，但每次都得到相同的輸出，那麼我們可能只需要使用一個輸出。

示例1

考慮以下資料框：

ID<−1:20
x<−sample(0:2,20,replace=TRUE)
df1<−data.frame(ID,x)
df1

輸出

刪除df1列x中的連續重複項：

Repeated1<−cumsum(rle(as.character(df1$x))$length)
df1[Repeated1,]

輸出

示例2

線上演示

ID<−1:20
y<−sample(1:5,20,replace=TRUE)
df2<−data.frame(ID,y)
df2

輸出

刪除df2列y中的連續重複項：

Repeated2<−cumsum(rle(as.character(df2$y))$length)
df2[Repeated2,]

輸出

示例3

線上演示

ID<−1:20
z<−sample(11:13,20,replace=TRUE)
df3<−data.frame(ID,z)
df3

輸出

刪除df3列z中的連續重複項：

Repeated3<−cumsum(rle(as.character(df3$z))$length)
df3[Repeated3,]

輸出

Nizamuddin Siddiqui

更新於：2020年11月7日

151 次檢視

啟動您的職業生涯

完成課程獲得認證

開始