- Seaborn 教程
- Seaborn - 首頁
- Seaborn - 簡介
- Seaborn - 環境設定
- 匯入資料集和庫
- Seaborn - 圖表美化
- Seaborn - 調色盤
- Seaborn - 直方圖
- Seaborn - 核密度估計
- 視覺化成對關係
- Seaborn - 繪製分類資料
- 觀測值的分佈
- Seaborn - 統計估計
- Seaborn - 繪製寬格式資料
- 多面板分類圖
- Seaborn - 線性關係
- Seaborn - 分面網格
- Seaborn - 對網格
- 函式參考
- Seaborn - 函式參考
- Seaborn 有用資源
- Seaborn - 快速指南
- Seaborn - 有用資源
- Seaborn - 討論
Seaborn - 統計估計
在大多數情況下,我們處理的是整個資料分佈的估計。但是當涉及到中心趨勢估計時,我們需要一種特定的方法來總結分佈。均值和中位數是經常用來估計分佈中心趨勢的技術。
在我們上面部分學習的所有圖表中,我們都對整個分佈進行了視覺化。現在,讓我們討論一下我們可以用哪些圖表來估計分佈的中心趨勢。
條形圖
barplot()顯示了分類變數和連續變數之間的關係。資料以矩形條表示,其中條的長度表示該類別中資料的比例。
條形圖表示中心趨勢的估計。讓我們使用“泰坦尼克號”資料集來學習條形圖。
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()
輸出
在上面的例子中,我們可以看到每個等級中男性和女性的平均生存人數。從圖中我們可以看出,女性的生存人數多於男性。在男性和女性中,頭等艙的生存人數較多。
barplot的一個特例是顯示每個類別中的觀測值數量,而不是計算第二個變數的統計量。為此,我們使用countplot()。
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()
輸出
圖表顯示,三等艙的乘客數量高於一等艙和二等艙。
點圖
點圖與條形圖的作用相同,但樣式不同。它不是使用完整的條形,而是用某個高度的點在另一條軸上表示估計值。
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()
輸出
廣告