使用 Python 中的 matplotlib 進行活躍產品銷售分析
Python 中的 Matplotlib 具有各種函式,如 read_csv、sort_values、group_by 等,用於執行銷售資料分析。任何從事任何型別產品銷售的線上業務都使用產品銷售資料分析來增加銷售額並更好地瞭解客戶。任何從事任何型別的電子商務業務的公司都使用其銷售和客戶資料來識別趨勢、模式和見解,這些見解可用於改進銷售和收入。銷售資料可用於確定哪種產品吸引力最高,哪個節日季需求量最大,以及許多其他有助於增加銷售額的趨勢。
Python 是一種流行的資料分析和視覺化程式語言。Python 提供了許多可用於有效進行產品銷售分析的庫和工具。在本文中,我們將使用 Matplotlib(Python 中流行的資料視覺化庫)進行活躍產品銷售分析。
我們將使用示例銷售資料,使用 numpy、pandas 和 matplotlib 進行活躍產品銷售分析。示例銷售資料可在此處找到。
分步銷售資料分析
資料讀取和處理
本例中用於分析的示例銷售資料包含以下列:
訂單編號 |
產品型別 |
數量 |
單價 |
訂單日期 |
地址 |
訂單編號 - 每個已下訂單的唯一編號。
產品型別 - 產品類別
數量 - 訂購產品的數量
單價 - 每單位價格
訂單日期 - 下訂單的日期和時間
地址 - 產品交付的地址。
我們將需要匯入 pandas 和 numpy,它們可用於讀取和處理示例銷售資料。以下是讀取資料的程式碼:
示例銷售資料可在 Kaggle 平臺上找到 此處。
示例
import pandas as pd import numpy as np import io from google.colab import files uploaded = files.upload() # read csv data Sales_data = pd.read_csv(io.BytesIO(uploaded['sample_sales_data.csv']), encoding='cp1252') Sales_data.sort_values(by=['ORDER_NUMBER'])
輸出
讀取資料後,我們需要處理資料。“訂單日期”列需要轉換為 DateTime 物件,我們可以從訂單日期中提取月份和年份,併為月份、年份和總銷售額新增新列。資料清理和處理的程式碼如下所示:
示例
Sales_data['ORDER_DATE'] = pd.to_datetime(Sales_data['ORDER_DATE']) Sales_data['MONTH'] = Sales_data['ORDER_DATE'].dt.month Sales_data['YEAR'] = Sales_data['ORDER_DATE'].dt.year Sales_data['TOTAL_SALES'] = Sales_data['QUANTITY'] * Sales_data['PRICE_EACH'] Sales_data.sort_values(by=['ORDER_NUMBER'])
輸出
新的月份、年份和總銷售額列將幫助我們分析隨時間推移的銷售趨勢。現在,我們可以使用這些列使用 matplotlib 庫繪製不同的圖表,以從 sample_sales_data 中獲得一些見解。
資料視覺化
到目前為止,我們已經讀取並處理了我們的資料,以便使用 Python 中的 matplotlib 庫繪製不同的圖表。Matplotlib 提供線狀圖、條形圖和散點圖來視覺化資料。
隨時間推移的總銷售額視覺化
為了視覺化隨時間推移的總銷售額,我們可以使用 matplotlib 繪製線形圖。為此,我們需要:
按年份和月份分組資料
使用 matplotlib 建立折線圖
設定標題和軸標籤
顯示圖表
示例
import matplotlib.pyplot as plt # Group the data by year and month sales_by_month = Sales_data.groupby(['YEAR', 'MONTH']).sum()['TOTAL_SALES'].reset_index() # Create a line chart plt.plot(sales_by_month.index, sales_by_month.values) # Set the title and axis labels plt.title('Total Sales by Month') plt.xlabel('Month') plt.ylabel('Sales ($)') # Display the chart plt.show()
輸出
隨時間推移的年度收入視覺化
我們可以視覺化每年的年度收入,並檢視哪一年收入最高,哪一年收入最低。為此,我們需要:
按年份分組銷售資料
使用 Seaborn(底層使用 matplotlib)建立條形圖
設定標題和軸標籤
顯示圖表
示例
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Annual Revenue plt.figure(figsize=(10,6)) yearly_revenue = Sales_data.groupby(['YEAR'])['TOTAL_SALES'].sum().reset_index() sns.barplot(x="YEAR", y="TOTAL_SALES", data=yearly_revenue) plt.title('Annual Revenue', fontsize = 20) plt.xlabel('Year', fontsize = 16) plt.ylabel('Revenue', fontsize = 16) plt.show()
輸出
結論
我們可以使用 Python 中的 matplotlib 分析和視覺化任何型別的產品銷售資料,並獲得公司可用於增加銷售額的標準資料見解。我們在上文中使用 Python 中的 matplotlib、pandas 和 numpy 分析了隨時間推移的總銷售額和按年度計算的收入。