Python - 重新排列 Pandas DataFrame 中的資料


我們可以透過對特定列進行分類,輕鬆地重新排列資料。在此,我們將對“結果”列進行分類,即數字形式的及格和不及格值。

匯入必需的庫 −

import pandas as pd

使用 2 列建立 DataFrame −

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']

   }
)

使用 map() 函式重新排列資料,並只將“及格”設定為 1,“不及格”設定為 0 −

dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

示例

以下是程式碼 −

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# reshaping into numbers
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

print"\nReshaped DataFrame ...\n",dataFrame

輸出

將產生以下輸出

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Fail       Ted
3    Pass  Scarlett
4    Pass       Kat

Reshaped DataFrame ...
   Result   Student
0       1      Jack
1       0     Robin
2       0       Ted
3       1  Scarlett
4       1       Kat

更新於: 2021-09-20

657 次瀏覽

開啟你的 職業生涯

完成課程,獲取認證

開始
廣告