如何在 Pandas Python 中找到資料框中特定列的標準差?


標準差說明了資料集中值的分佈情況。它們還說明了資料集中值與資料集中列的算術平均值的距離。

有時,可能需要獲取本質上為數值型別的特定列的標準差。這就是可以使用 std() 函式的地方。需要計算平均值的列可以索引到資料框中,並且可以使用點運算子在此列上呼叫平均值函式。

還可以傳遞列的索引以查詢標準差。

讓我們來看一個演示 -

示例

 線上演示

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The standard deviation of column 'Age' is :")
print(my_df['Age'].std())
print("The standard deviation of column 'value' is :")
print(my_df['value'].std())

輸出

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The standard deviation of column 'Age' is :
31.499206339207976
The standard deviation of column 'value' is :
35.747101700697364

解釋

  • 匯入所需的庫,併為方便使用賦予別名。

  • 建立由鍵和值組成的系列字典,其中值實際上是系列資料結構。

  • 稍後將此字典作為引數傳遞給“pandas”庫中存在的“Dataframe”函式

  • 在控制檯上列印資料框。

  • 我們正在檢視計算包含數值的特定列的標準差。

  • 透過使用點運算子指定列的名稱,在資料框上呼叫“std”函式。

  • 在控制檯上列印數值列的標準差。

更新於: 2020-12-10

6K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

立即開始
廣告