編寫一個 Python 程式,以刪除給定資料框中的第一行重複項
假設您有一個數據框並且移除第一行重複項的結果是,
Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14
解決方案
為解決這個問題,我們將按照以下步驟操作:
定義一個數據框
在 Id 和 Age 列內應用 drop_duplicates 函式,然後將 keep 初始值指定為“last”。
df.drop_duplicates(subset=['Id','Age'],keep='last')
將結果儲存在相同的資料框內並打印出來
示例
讓我們檢視以下實現以獲得更好的理解:
import pandas as pd df = pd.DataFrame({'Id':[1,2,3,4,5,6,2,7,3,9,10], 'Age':[12,13,14,13,14,12,13,16,14,15,14] }) print("DataFrame is:\n",df) df = df.drop_duplicates(subset=['Id','Age'],keep='last') print("Dataframe after removing first duplicate rows:\n", df)
輸出
DataFrame is: Id Age 0 1 12 1 2 13 2 3 14 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14 Dataframe after removing first duplicate rows: Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14
廣告