編寫一個 Python 程式,以刪除給定資料框中的第一行重複項


假設您有一個數據框並且移除第一行重複項的結果是,

    Id Age
0    1 12
3    4 13
4    5 14
5    6 12
6    2 13
7    7 16
8    3 14
9    9 15
10  10 14

解決方案

為解決這個問題,我們將按照以下步驟操作:

  • 定義一個數據框

  • 在 Id 和 Age 列內應用 drop_duplicates 函式,然後將 keep 初始值指定為“last”。

df.drop_duplicates(subset=['Id','Age'],keep='last')
  • 將結果儲存在相同的資料框內並打印出來

示例

讓我們檢視以下實現以獲得更好的理解:

import pandas as pd
df = pd.DataFrame({'Id':[1,2,3,4,5,6,2,7,3,9,10],
                     'Age':[12,13,14,13,14,12,13,16,14,15,14]
                  })
print("DataFrame is:\n",df)
df = df.drop_duplicates(subset=['Id','Age'],keep='last')
print("Dataframe after removing first duplicate rows:\n", df)

輸出

DataFrame is:
    Id    Age
0    1    12
1    2    13
2    3    14
3    4    13
4    5    14
5    6    12
6    2    13
7    7    16
8    3    14
9    9    15
10  10    14
Dataframe after removing first duplicate rows:
    Id Age
0    1 12
3    4 13
4    5 14
5    6 12
6    2 13
7    7 16
8    3 14
9    9 15
10  10 14

更新於:25-Feb-2021

252 次瀏覽

開啟你的 職業生涯

透過完成課程認證

開始
廣告