Seaborn - 匯入資料集和庫



本章將討論如何匯入資料集和庫。讓我們首先了解如何匯入庫。

匯入庫

讓我們首先匯入 Pandas,這是一個用於管理關係型(表格格式)資料集的優秀庫。在處理 DataFrame 時,Seaborn 非常方便,DataFrame 是資料分析中最廣泛使用的資料結構。

以下命令將幫助您匯入 Pandas:

# Pandas for managing datasets
import pandas as pd

現在,讓我們匯入 Matplotlib 庫,它可以幫助我們自定義繪圖。

# Matplotlib for additional customization
from matplotlib import pyplot as plt

我們將使用以下命令匯入 Seaborn 庫:

# Seaborn for plotting and styling
import seaborn as sb

匯入資料集

我們已經匯入了所需的庫。在本節中,我們將瞭解如何匯入所需的資料集。

Seaborn 庫包含一些重要的資料集。安裝 Seaborn 時,資料集會自動下載。

您可以使用這些資料集中的任何一個進行學習。您可以使用以下函式載入所需的資料集

load_dataset()

將資料匯入為 Pandas DataFrame

在本節中,我們將匯入一個數據集。預設情況下,此資料集將作為 Pandas DataFrame 載入。如果 Pandas DataFrame 中有任何函式,它都將作用於此 DataFrame。

以下程式碼行將幫助您匯入資料集:

# Seaborn for plotting and styling
import seaborn as sb
df = sb.load_dataset('tips')
print df.head()

以上程式碼行將生成以下輸出:

   total_bill  tip   sex    smoker day  time   size
0    16.99    1.01   Female  No    Sun  Dinner  2
1    10.34    1.66   Male    No    Sun  Dinner  3
2    21.01    3.50   Male    No    Sun  Dinner  3
3    23.68    3.31   Male    No    Sun  Dinner  2
4    24.59    3.61   Female  No    Sun  Dinner  4

要檢視 Seaborn 庫中所有可用的資料集,您可以使用以下命令和get_dataset_names() 函式,如下所示:

import seaborn as sb
print sb.get_dataset_names()

以上程式碼行將返回以下輸出,其中列出了可用的資料集

[u'anscombe', u'attention', u'brain_networks', u'car_crashes', u'dots', 
u'exercise', u'flights', u'fmri', u'gammas', u'iris', u'planets', u'tips', 
u'titanic']

DataFrame 以矩形網格的形式儲存資料,可以輕鬆檢視資料。矩形網格的每一行包含一個例項的值,網格的每一列都是一個向量,包含特定變數的資料。這意味著 DataFrame 的行不需要包含相同資料型別的值,它們可以是數字、字元、邏輯值等。Python 的 DataFrame 來自 Pandas 庫,它們被定義為具有潛在不同型別列的二維標記資料結構。

有關 DataFrame 的更多詳細資訊,請訪問我們的pandas 教程

廣告
© . All rights reserved.