Seaborn - 統計估計



在大多數情況下,我們處理的是整個資料分佈的估計。但是當涉及到中心趨勢估計時,我們需要一種特定的方法來總結分佈。均值和中位數是經常用來估計分佈中心趨勢的技術。

在我們上面部分學習的所有圖表中,我們都對整個分佈進行了視覺化。現在,讓我們討論一下我們可以用哪些圖表來估計分佈的中心趨勢。

條形圖

barplot()顯示了分類變數和連續變數之間的關係。資料以矩形條表示,其中條的長度表示該類別中資料的比例。

條形圖表示中心趨勢的估計。讓我們使用“泰坦尼克號”資料集來學習條形圖。

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

輸出

barplot

在上面的例子中,我們可以看到每個等級中男性和女性的平均生存人數。從圖中我們可以看出,女性的生存人數多於男性。在男性和女性中,頭等艙的生存人數較多。

barplot的一個特例是顯示每個類別中的觀測值數量,而不是計算第二個變數的統計量。為此,我們使用countplot()

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()

輸出

Bargraph

圖表顯示,三等艙的乘客數量高於一等艙和二等艙。

點圖

點圖與條形圖的作用相同,但樣式不同。它不是使用完整的條形,而是用某個高度的點在另一條軸上表示估計值。

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

輸出

zSymbol
廣告
© . All rights reserved.