Pandas 中 series.describe 方法有什麼作用?


pandas.series 中的 describe() 方法用於生成序列物件的統計描述。此方法分析數值和物件序列的描述。

因此,describe() 方法返回序列的彙總統計資訊。它根據輸入序列物件的型別而有所不同。

對於數值序列,describe() 方法分析基本統計資訊,如計數、均值、標準差、最小值、最大值和分位數(25%、50% 和 75%)。50% 分位數與中位數相同。

如果序列物件包含物件型別資料,則 describe() 方法分析基本統計資訊,如計數、唯一值、最常出現的值和頻率。

示例 1

# importing required packages
import pandas as pd

# creating pandas Series object
series = pd.Series([9,2,3,5,8,9,1,4,6])
print(series)

# apply describe method
print("output",series.describe())

解釋

最初,我們使用 Python 整數列表建立了一個 Pandas 序列。並使用 describe() 方法分析了序列物件的統計資訊。

輸出

0 9
1 2
2 3
3 5
4 8
5 9
6 1
7 4
8 6
dtype: int64

Output count  9.000000
mean 5.222222
std  2.990726
min  1.000000
25%  3.000000
50%  5.000000
75%  8.000000
max  9.000000
dtype: float64

我們計算了數值序列物件的基線統計資訊,結果顯示在上面的輸出塊中。計數表示給定序列物件的元素數量。同樣,我們分析了均值、最小值、最大值、標準差等。

示例 2

# importing required packages
import pandas as pd

# creating pandas Series object
series = pd.Series(['A', 'B', 'E', 'C', 'A', 'D', 'D', 'E', 'F', 'C', 'B', 'A'])
print(series)

# apply describe method
print("Output: ">"",series.describe())

解釋

在以下示例中,我們計算了物件型別 Pandas 序列的統計資訊。為此,我們使用字串列表建立了一個序列物件。

輸出

0  A
1  B
2  E
3  C
4  A
5  D
6  D
7  E
8  F
9  C
10 B
11 A
dtype: object

Output count 12
unique 6
top    A
freq   3
dtype: object

我們獲得了序列元素的計數、唯一值的總數、最常出現(頻率最高)的元素以及最常出現值的頻率。

更新於: 2022-03-09

530 次檢視

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.