- Seaborn 教程
- Seaborn - 首頁
- Seaborn - 簡介
- Seaborn - 環境配置
- 匯入資料集和庫
- Seaborn - 圖表美化
- Seaborn - 調色盤
- Seaborn - 直方圖
- Seaborn - 核密度估計
- 視覺化成對關係
- Seaborn - 繪製分類資料
- 觀測值的分佈
- Seaborn - 統計估計
- Seaborn - 繪製寬格式資料
- 多面板分類圖
- Seaborn - 線性關係
- Seaborn - Facet Grid
- Seaborn - Pair Grid
- 函式參考
- Seaborn - 函式參考
- Seaborn 有用資源
- Seaborn - 快速指南
- Seaborn - 有用資源
- Seaborn - 討論
Seaborn.scatterplot() 方法
Seaborn.scatterplot() 方法可以繪製散點圖,並支援多種語義分組。也就是說,可以對變數進行分組,並繪製這些變數的圖形表示。
散點圖是一種圖形,也是一種資料視覺化工具,用於表示資料集中的任意兩點之間的關係。它們用於繪製二維圖形,可以使用色相、大小和樣式引數進行增強。該圖最多可以獨立對映三個變數,但這種圖難以解釋,通常效率低下。在這種情況下,我們可以使用冗餘語義來使圖形更易於理解。
語法
seaborn.scatterplot() 函式的語法如下。
seaborn.scatterplot(*, x=None, y=None, hue=None, style=None, size=None, data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=True, style_order=None, x_bins=None, y_bins=None, units=None, estimator=None, ci=95, n_boot=1000, alpha=None, x_jitter=None, y_jitter=None, legend='auto', ax=None, **kwargs)
引數
下面討論 scatterplot() 方法的一些引數。
| 序號 | 引數和描述 |
|---|---|
| 1 | x,y 表示在 x,y 軸上的變數。 |
| 2 | 色相 (Hue) 這將生成具有不同顏色的元素。它是一個分組變數。 |
| 3 | 大小 (Size) 這將生成具有不同大小的元素。它也是一個分組變數。 |
| 4 | 樣式 (Style) 這將生成具有不同樣式的元素。 |
| 5 | 資料 (Data) 此引數接受輸入資料結構。即對映或序列。 |
| 7 | 色相順序 (Hue_order) 在色相語義中繪製分類變數的順序。 |
| 8 | 型別 (Kind) 對應於要繪製的圖的型別。可以是線型或散點型。散點圖是預設設定。 |
| 9 | 調色盤 (Palette) 此引數用於設定對映的色調。可以是明亮的、柔和的、深色的等。 |
| 10 | 高度、寬度 這些是確定繪圖高度和寬度的標量。 |
| 11 | 圖例 (Legend) 可以是“auto”、“brief”、“full”或“false”。根據給定的值,組將放置在圖例中。 |
| 12 | 置信區間 (Ci) 聚合估計量時的置信區間大小。 |
返回值
scatterplot() 方法返回包含已繪製點的 matplotlib 座標軸。
載入 Seaborn 庫
在繼續繪製圖表之前,讓我們載入 Seaborn 庫和資料集。要載入或匯入 Seaborn 庫,可以使用以下程式碼行。
Import seaborn as sns
載入資料集
在本文中,我們將使用 Seaborn 庫中內建的泰坦尼克號資料集。使用以下命令載入資料集。
dts=sns.load_dataset("titanic")
以下命令用於檢視資料集中前 5 行。這使我們能夠理解可以使用哪些變數來繪製圖表。
dts.head()
以下是上述程式碼段的輸出。
index,survived,pclass,sex,age,sibsp,parch,fare,embarked,class,who,adult_male,deck,embark_town,alive,alone 0,0,3,male,22.0,1,0,7.25,S,Third,man,true,NaN,Southampton,no,false 1,1,1,female,38.0,1,0,71.2833,C,First,woman,false,C,Cherbourg,yes,false 2,1,3,female,26.0,0,0,7.925,S,Third,woman,false,NaN,Southampton,yes,true
示例 1
第一個示例將演示如何使用函式中的三個引數繪製基本散點圖。
import seaborn as sns
import matplotlib.pyplot as plt
dts=sns.load_dataset("titanic")
dts.head()
sns.scatterplot(data=dts,x="age",y="fare",hue="sex")
plt.show()
輸出
這裡,圖表繪製為男性和女性的年齡和票價之間的關係。
更改調色盤顏色
要更改圖表的調色盤顏色,可以使用以下程式碼行。
sns.set_palette("muted")
示例 2
此示例將演示在 scatterplot() 方法中使用 4 個引數。
對於此資料集,此圖有助於檢視不同性別和不同人群的年齡和票價之間的變化。
import seaborn as sns
import matplotlib.pyplot as plt
dts=sns.load_dataset("titanic")
dts.head()
sns.scatterplot(data=dts,x="age",y="fare",hue="class",style="sex")
plt.show()
輸出
示例 3
在此示例中,我們將瞭解如何使用引數 legend 和 sizes。Legend 是確定應將哪些資料放置在圖例中的引數。如果它是 full,所有組都將放置在圖例中,否則,只有部分組將被放置。因此,在此示例中,資料集中的所有組都將放置在圖例中。
Sizes 確定如何為“size”引數選擇大小。因此,在此示例中,大小最小為 20,最大為 70。這意味著對於 size 引數,顯示的資料點將在這個大小範圍內變化。
import seaborn as sns
import matplotlib.pyplot as plt
dts=sns.load_dataset("titanic")
dts.head()
sns.scatterplot( data=dts, x="age", y="fare", hue="survived",size="survived", sizes=(20, 70), legend="full" )
plt.show()
輸出
示例 4
在此示例中,我們將傳遞一個新的引數 hue_norm,它將採用數值或字串值。它基本上用於指定在“hue”引數中給定的分類變數的處理和繪製順序。
我們使用的 hue_norm 值為 (0,3)。這意味著對於 survived 變數,根據資料集中 survived 列的值,其值從 0 到 3。
import seaborn as sns
import matplotlib.pyplot as plt
dts=sns.load_dataset("titanic")
dts.head()
sns.scatterplot(
data=dts, x="age", y="fare", hue="survived", size="survived",
sizes=(20, 70),hue_norm=(0, 3), legend="full",palette="deep"
)
plt.show()
輸出