Python - 如何按月份對 Pandas 資料框分組?


我們將會使用 groupby 對 Pandas 資料框進行分組。使用 grouper 函式選擇需要使用的列。我們將會按月份分組,並針對下方的汽車銷售記錄計算每月的註冊費總和來作為示例。

首先,假設以下為帶有三列的 Pandas 資料框 −

dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"],

      "Date_of_Purchase": [
         pd.Timestamp("2021-06-10"),
         pd.Timestamp("2021-07-11"),
         pd.Timestamp("2021-06-25"),      
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2021-03-20"),
         pd.Timestamp("2021-01-22"),  
         pd.Timestamp("2021-01-06"),
         pd.Timestamp("2021-01-04"),
         pd.Timestamp("2021-05-09")
      ],
     "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

在 groupby() 函式內使用分組器選擇 Date_of_Purchase 列。將頻率 freq 設定為“M”以按月份分組 −

print("\nGroup Dataframe by month...\n",dataFrame.groupby(pd.Grouper(key='Date_of_Purchase', axis=0, freq='M')).sum())

示例

以下是程式碼 −

import pandas as pd

# dataframe with one of the columns as Date_of_Purchase
dataFrame = pd.DataFrame(
    {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"],

      "Date_of_Purchase": [
         pd.Timestamp("2021-06-10"),
         pd.Timestamp("2021-07-11"),
         pd.Timestamp("2021-06-25"),
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2021-03-20"),
         pd.Timestamp("2021-01-22"),
         pd.Timestamp("2021-01-06"),
         pd.Timestamp("2021-01-04"),
         pd.Timestamp("2021-05-09")
      ],

      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

print"DataFrame...\n",dataFrame

# Grouper to select Date_of_Purchase column within groupby function
print"\nGroup Dataframe by month...\n",dataFrame.groupby(pd.Grouper(key='Date_of_Purchase', axis=0, freq='M')).sum()

輸出

這會生成以下輸出。每個月的註冊費均得到計算 −

DataFrame...
     Car     Date_of_Purchase     Reg_Price
0     Audi     2021-06-10            1000
1    Lexus     2021-07-11            1400
2    Tesla     2021-06-25            1100
3 Mercedes     2021-06-29             900
4      BMW     2021-03-20            1700
5   Toyota     2021-01-22            1800
6   Nissan     2021-01-06            1300
7  Bentley     2021-01-04            1150
8  Mustang     2021-05-09            1350
 Group Dataframe by month...
                    Reg_Price
Date_of_Purchase
2021-01-31             4250.0
2021-02-28                NaN
2021-03-31             1700.0
2021-04-30                NaN
2021-05-31             1350.0
2021-06-30             3000.0
2021-07-31             1400.0

更新於: 09-Sep-2021

2 千+ 次瀏覽

開啟您的 職業

透過完成課程獲取認證

開始
廣告