Python – 只顯示 DataFrame 中的非重複值


我們將學習如何僅顯示未重複值。首先,我們將建立一個帶有重複值的資料幀 −

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

上面,我們建立了 2 列。若要僅顯示非重複的值,請使用 duplicated() 方法和邏輯 NOT。透過這種方式,將獲取非重複值 −

dataFrame[~dataFrame.duplicated('Student')]

示例

以下為完整程式碼 −

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# displaying non-duplicates
res = dataFrame[~dataFrame.duplicated('Student')]
print"\nDataFrame after removing duplicates ...\n",res

輸出

這將生成以下輸出 −

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Pass       Ted
3    Fail     Robin
4    Pass  Scarlett
5    Pass       Kat
6    Pass       Ted

DataFrame after removing duplicates ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Pass       Ted
4    Pass  Scarlett
5    Pass       Kat

2021 年 9 月 20 日更新

4K+ 瀏覽次數

開啟您的職業生涯

完成課程以獲得認證

開始
廣告
© . All rights reserved.