從列表建立 Pandas DataFrame
Pandas DataFrame 是一個具有行和列的二維表格,這些行和列是不可變的,這意味著一旦建立它們就不能更改。從頭開始使用列表建立 DataFrame 是資料科學和資訊科技中的一項常見任務。列表是有序元素的集合,它是 Python 中最常用的資料結構之一。列表可以儲存任何型別的值,例如數字、字串和布林值。
在本教程中,我將詳細解釋如何使用分步說明、程式碼片段和每個子部分的解釋,結合實際案例,從列表建立 Pandas DataFrame。
DataFrame 和列表之間有哪些主要區別?
列表是 Python 中的基本資料結構,可以儲存任何資料型別的元素集合,而 DataFrame 是一種二維表格結構,類似於電子表格或 SQL 表格,用於以行和列的形式儲存資料。以下是 DataFrame 和列表之間的一些主要區別:
結構 - 列表是簡單的、一維的值集合,而 DataFrame 是具有行和列的二維表格結構。
資料型別 - 列表可以儲存任何資料型別的元素,包括數字、字串,甚至其他列表,而 DataFrame 旨在以表格格式儲存資料,列具有特定的資料型別,例如整數、浮點數和字串。
大小 - 列表可以儲存任意數量的元素,而 DataFrame 通常設計用於儲存大量資料,可能包含數百萬行和列。
操作 - 列表支援基本操作,例如索引、切片和追加,而 DataFrame 支援更復雜的操作,例如過濾、連線和分組。
資料操作 - 列表提供基本的資料操作功能,而 DataFrame 提供強大的資料操作工具,例如根據特定條件過濾、排序和聚合資料。
先決條件
在我們深入研究任務之前,需要在您的系統上安裝一些東西:
推薦設定列表:
pip install pandas, bokeh
預計使用者可以使用任何獨立的 IDE,例如 VS-Code、PyCharm、Atom 或 Sublime text。
也可以使用線上 Python 編譯器,例如 Kaggle.com、Google Cloud 平臺或任何其他編譯器。
更新版本的 Python。在撰寫本文時,我使用了 3.10.9 版本。
瞭解如何使用 Jupyter notebook。
虛擬環境的知識和應用將是有益的,但不是必需的。
還預計使用者對統計學和數學有良好的理解。
所需步驟
匯入庫
要在 Pandas 中建立 DataFrame,我們需要匯入 Pandas 庫。以下程式碼用於匯入 Pandas 庫:
import pandas as pd
建立列表
在我們使用列表建立 DataFrame 之前,我們首先需要建立列表來儲存資料。在本節中,我將向您展示如何使用簡單資料和實際案例建立列表。
建立姓名列表
names = ['John', 'Mary', 'Peter', 'Jane', 'Daniel']
在上面的程式碼片段中,我們建立了一個名為 `names` 的列表,其中包含五個字串值,表示個人的姓名。
建立年齡列表
ages = [32, 25, 41, 29, 36]
在上面的程式碼片段中,我們建立了一個名為 `ages` 的列表,其中包含五個整數值,表示個人的年齡。
建立布林值列表
current_status = [True, False, True, False, True]
在上面的程式碼片段中,我們建立了一個名為 `current_status` 的列表,其中包含五個布林值,表示個人的當前狀態。
從列表建立 DataFrame
一旦我們有了包含資料的列表,我們就可以使用 `pd.DataFrame()` 函式在 Pandas 中建立 DataFrame。我們可以將列表作為引數傳遞給 `pd.DataFrame()` 函式。以下程式碼用於從列表建立 DataFrame:
df = pd.DataFrame(list(zip(names, ages, current_status)), columns=['Name', 'Age', 'Current_Status'])
在上面的程式碼片段中,我們首先使用 `zip()` 函式建立了一個元組列表。`zip()` 函式將列表組合成一個元組列表。然後,我們將此元組列表作為第一個引數傳遞給 `pd.DataFrame()` 函式。
傳遞給 `pd.DataFrame()` 函式的第二個引數是 DataFrame 的列名列表。在本例中,我們使用 `columns=['Name', 'Age', 'Current_Status']` 將列名指定為 `Name`、`Age` 和 `Current_Status`。
檢視 DataFrame
建立 DataFrame 後,我們可以使用 `.head()` 函式檢視 DataFrame 的前幾行。以下程式碼用於顯示 DataFrame 的前幾行:
print(df.head())
在上面的程式碼片段中,我們使用 `.head()` 函式顯示了 DataFrame 的前幾行。
輸出
Name Age Current_Status 0 John 32 True 1 Mary 25 False 2 Peter 41 True 3 Jane 29 False 4 Daniel 36 True
在上面的輸出中,我們可以看到從列表建立 DataFrame 的結果。
結論
在本教程中,我提供了有關如何從列表建立 Pandas DataFrame 的分步指南。我演示瞭如何匯入 Pandas 庫、建立列表以及如何使用 `pd.DataFrame()` 函式建立 DataFrame。此外,我還展示瞭如何使用 `.head()` 函式檢視 DataFrame 的前幾行。透過遵循這些說明,您現在應該能夠使用實際案例從列表建立 Pandas DataFrame。
資料結構
網路
關係型資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C 語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP