Seaborn.scatterplot() 方法



Seaborn.scatterplot() 方法可以繪製散點圖,並支援多種語義分組。也就是說,可以對變數進行分組,並繪製這些變數的圖形表示。

散點圖是一種圖形,也是一種資料視覺化工具,用於表示資料集中的任意兩點之間的關係。它們用於繪製二維圖形,可以使用色相、大小和樣式引數進行增強。該圖最多可以獨立對映三個變數,但這種圖難以解釋,通常效率低下。在這種情況下,我們可以使用冗餘語義來使圖形更易於理解。

語法

seaborn.scatterplot() 函式的語法如下。

seaborn.scatterplot(*, x=None, y=None, hue=None, style=None, size=None, data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=True, style_order=None, x_bins=None, y_bins=None, units=None, estimator=None, ci=95, n_boot=1000, alpha=None, x_jitter=None, y_jitter=None, legend='auto', ax=None, **kwargs)

引數

下面討論 scatterplot() 方法的一些引數。

序號 引數和描述
1 x,y

表示在 x,y 軸上的變數。

2 色相 (Hue)

這將生成具有不同顏色的元素。它是一個分組變數。

3 大小 (Size)

這將生成具有不同大小的元素。它也是一個分組變數。

4 樣式 (Style)

這將生成具有不同樣式的元素。

5 資料 (Data)

此引數接受輸入資料結構。即對映或序列。

7 色相順序 (Hue_order)

在色相語義中繪製分類變數的順序。

8 型別 (Kind)

對應於要繪製的圖的型別。可以是線型或散點型。散點圖是預設設定。

9 調色盤 (Palette)

此引數用於設定對映的色調。可以是明亮的、柔和的、深色的等。

10 高度、寬度

這些是確定繪圖高度和寬度的標量。

11 圖例 (Legend)

可以是“auto”、“brief”、“full”或“false”。根據給定的值,組將放置在圖例中。

12 置信區間 (Ci)

聚合估計量時的置信區間大小。

返回值

scatterplot() 方法返回包含已繪製點的 matplotlib 座標軸。

載入 Seaborn 庫

在繼續繪製圖表之前,讓我們載入 Seaborn 庫和資料集。要載入或匯入 Seaborn 庫,可以使用以下程式碼行。

Import seaborn as sns

載入資料集

在本文中,我們將使用 Seaborn 庫中內建的泰坦尼克號資料集。使用以下命令載入資料集。

dts=sns.load_dataset("titanic")

以下命令用於檢視資料集中前 5 行。這使我們能夠理解可以使用哪些變數來繪製圖表。

dts.head()

以下是上述程式碼段的輸出。

index,survived,pclass,sex,age,sibsp,parch,fare,embarked,class,who,adult_male,deck,embark_town,alive,alone
0,0,3,male,22.0,1,0,7.25,S,Third,man,true,NaN,Southampton,no,false
1,1,1,female,38.0,1,0,71.2833,C,First,woman,false,C,Cherbourg,yes,false
2,1,3,female,26.0,0,0,7.925,S,Third,woman,false,NaN,Southampton,yes,true

示例 1

第一個示例將演示如何使用函式中的三個引數繪製基本散點圖。

import seaborn as sns
import matplotlib.pyplot as plt
dts=sns.load_dataset("titanic")
dts.head()
sns.scatterplot(data=dts,x="age",y="fare",hue="sex")
plt.show()

輸出

basic scatterplot

這裡,圖表繪製為男性和女性的年齡和票價之間的關係。

更改調色盤顏色

要更改圖表的調色盤顏色,可以使用以下程式碼行。

sns.set_palette("muted")

示例 2

此示例將演示在 scatterplot() 方法中使用 4 個引數。

對於此資料集,此圖有助於檢視不同性別和不同人群的年齡和票價之間的變化。

import seaborn as sns
import matplotlib.pyplot as plt
dts=sns.load_dataset("titanic")
dts.head()
sns.scatterplot(data=dts,x="age",y="fare",hue="class",style="sex")
plt.show()

輸出

4_parameters_scatterplot.jpg

示例 3

在此示例中,我們將瞭解如何使用引數 legend 和 sizes。Legend 是確定應將哪些資料放置在圖例中的引數。如果它是 full,所有組都將放置在圖例中,否則,只有部分組將被放置。因此,在此示例中,資料集中的所有組都將放置在圖例中。

Sizes 確定如何為“size”引數選擇大小。因此,在此示例中,大小最小為 20,最大為 70。這意味著對於 size 引數,顯示的資料點將在這個大小範圍內變化。

import seaborn as sns
import matplotlib.pyplot as plt
dts=sns.load_dataset("titanic")
dts.head()
sns.scatterplot( data=dts, x="age", y="fare", hue="survived",size="survived", sizes=(20, 70), legend="full" )
plt.show()

輸出

scatterplot

示例 4

在此示例中,我們將傳遞一個新的引數 hue_norm,它將採用數值或字串值。它基本上用於指定在“hue”引數中給定的分類變數的處理和繪製順序。

我們使用的 hue_norm 值為 (0,3)。這意味著對於 survived 變數,根據資料集中 survived 列的值,其值從 0 到 3。

import seaborn as sns
import matplotlib.pyplot as plt
dts=sns.load_dataset("titanic")
dts.head()
sns.scatterplot(
data=dts, x="age", y="fare", hue="survived", size="survived",
sizes=(20, 70),hue_norm=(0, 3), legend="full",palette="deep"
)
plt.show()

輸出

survived
seaborn_relational_plots_introduction.htm
廣告
© . All rights reserved.