Python Pandas - 根據總和從 DataFrame 過濾列


如需根據列的總和進行篩選,我們使用 loc() 方法。在我們的示例中,我們將每個學生的成績進行求和,以獲取學生列中成績高於 400(即 80%)的學生。

首先,使用學生記錄建立一個 DataFrame。有 3 個學生的成績記錄,即 3 列 -

dataFrame = pd.DataFrame({
   'Jacob_Marks': [95, 90, 75, 85, 88],'Ted_Marks': [60, 50, 65, 85, 70],'Jamie_Marks': [77, 76, 65, 45, 50]})

根據列進行篩選。獲取總成績高於 400 的學生 -

dataFrame = dataFrame.loc[:, dataFrame.sum(axis=0) > 400]

示例

以下是完整程式碼 -

import pandas as pd

# create a dataframe with 3 columns
dataFrame = pd.DataFrame({
   'Jacob_Marks': [95, 90, 75, 85, 88],'Ted_Marks': [60, 50, 65, 85, 70],'Jamie_Marks': [77, 76, 65, 45, 50]})

print"Dataframe...\n",dataFrame

# filtering on the basis of columns
# fetching student with total marks above 400
dataFrame = dataFrame.loc[:, dataFrame.sum(axis=0) > 400]

# dataframe
print"Updated Dataframe...\n",dataFrame

輸出

這將產生以下輸出 -

Dataframe...
   Jacob_Marks   Jamie_Marks   Ted_Marks
0          95            77          60
1          90            76          50
2          75            65          65
3          85            45          85
4          88            50          70
Updated Dataframe...
   Jacob_Marks
0          95
1          90
2          75
3          85
4          88

更新日期:16-Sep-2021

701 次瀏覽

開啟您的 職業 生涯

完成課程並獲得認證

開始
廣告
© . All rights reserved.