如何在 Pandas Python 中彙總資料?


可以使用不同的函式來獲取有關資料的大量資訊。但如果我們希望獲取資料的所有資訊,可以使用“describe”函式。

此函式將提供諸如“計數”、“均值”、“標準差”、“第25百分位數”、“第50百分位數”和“第75百分位數”等資訊。

示例

 線上演示

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The description of data is :")
print(my_df.describe())

輸出

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The description of data is :
          Age     value
count  5.000000  5.000000
mean  47.200000  46.554000
std   31.499206  35.747102
min   12.000000  8.790000
25%   23.000000  23.240000
50%   45.000000  31.980000
75%   67.000000  78.560000
max   89.000000  90.200000

解釋

  • 匯入所需的庫,併為方便使用賦予別名。
  • 建立由鍵和值組成的系列字典,其中值實際上是系列資料結構。
  • 此字典隨後作為引數傳遞給pandas庫中的“Dataframe”函式
  • 資料框列印在控制檯上。
  • 我們正在尋找獲取有關資料的所有資訊。
  • 在資料框上呼叫“describe”函式。
  • 描述列印在控制檯上。

更新於:2020年12月10日

88 次瀏覽

啟動您的職業生涯

完成課程獲得認證

開始學習
廣告