如何在 Pandas Python 中彙總資料?
可以使用不同的函式來獲取有關資料的大量資訊。但如果我們希望獲取資料的所有資訊,可以使用“describe”函式。
此函式將提供諸如“計數”、“均值”、“標準差”、“第25百分位數”、“第50百分位數”和“第75百分位數”等資訊。
示例
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The description of data is :") print(my_df.describe())
輸出
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The description of data is : Age value count 5.000000 5.000000 mean 47.200000 46.554000 std 31.499206 35.747102 min 12.000000 8.790000 25% 23.000000 23.240000 50% 45.000000 31.980000 75% 67.000000 78.560000 max 89.000000 90.200000
解釋
- 匯入所需的庫,併為方便使用賦予別名。
- 建立由鍵和值組成的系列字典,其中值實際上是系列資料結構。
- 此字典隨後作為引數傳遞給pandas庫中的“Dataframe”函式
- 資料框列印在控制檯上。
- 我們正在尋找獲取有關資料的所有資訊。
- 在資料框上呼叫“describe”函式。
- 描述列印在控制檯上。
廣告