如何在 Pandas Python 中找到資料框中特定列的標準差?
標準差說明了資料集中值的分佈情況。它們還說明了資料集中值與資料集中列的算術平均值的距離。
有時,可能需要獲取本質上為數值型別的特定列的標準差。這就是可以使用 std() 函式的地方。需要計算平均值的列可以索引到資料框中,並且可以使用點運算子在此列上呼叫平均值函式。
還可以傳遞列的索引以查詢標準差。
讓我們來看一個演示 -
示例
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The standard deviation of column 'Age' is :") print(my_df['Age'].std()) print("The standard deviation of column 'value' is :") print(my_df['value'].std())
輸出
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The standard deviation of column 'Age' is : 31.499206339207976 The standard deviation of column 'value' is : 35.747101700697364
解釋
匯入所需的庫,併為方便使用賦予別名。
建立由鍵和值組成的系列字典,其中值實際上是系列資料結構。
稍後將此字典作為引數傳遞給“pandas”庫中存在的“Dataframe”函式
在控制檯上列印資料框。
我們正在檢視計算包含數值的特定列的標準差。
透過使用點運算子指定列的名稱,在資料框上呼叫“std”函式。
在控制檯上列印數值列的標準差。
廣告