Pandas 中根據指定列選擇有限行


Pandas 是一個 Python 包,現在已成為全球資料科學家和分析師的首選工具。從資料框中選擇行和列是其眾多資料操作和分析功能之一。本文以實際示例探討了如何使用 Pandas 選擇具有特定列的一組行。

雖然我們強調了 Pandas 的一個特定功能,但請記住,該庫的功能遠不止於此,使其成為資料處理的關鍵工具。

Pandas DataFrame:簡介

對於 Python,Pandas 提供了一種快速、使用者友好的資料結構(DataFrame)和資料分析工具。“Pandas”這個名稱來源於計量經濟學中使用的術語“面板資料”,指的是包含多個時間段內相同人員的觀察結果的資料集。

在 Pandas 中根據指定列選擇有限行

在資料分析中,經常需要從 DataFrame 中選擇特定的行和列。在您只對分析或修改完整資料集的一部分感興趣的情況下,這可能很有幫助。以下是一些使用 Pandas 庫從一組列中選擇有限數量的行的方法

方法 1:使用 iloc 和 loc 方法

可以分別根據其整數索引和標籤使用 iloc 和 loc 方法選擇行和列。

示例 1:使用 iloc

import pandas as pd

# Create a simple dataframe
data = {
   'Name': ['John', 'Anna', 'Peter', 'Linda', 'Mike'],
   'Age': [28, 24, 35, 32, 30],
   'City': ['New York', 'Paris', 'Berlin', 'London', 'Sydney']
}

df = pd.DataFrame(data)

# Select the first three rows from the 'Name' and 'Age' columns
subset = df.iloc[:3, [0, 1]]
print(subset)

輸出

    Name  Age
0   John   28
1   Anna   24
2  Peter   35

示例 2:使用 loc

# Select the first three rows from the 'Name' and 'Age' columns
subset = df.loc[:2, ['Name', 'Age']]
print(subset)

方法 2:使用布林索引

您可以根據 DataFrame 的實際值使用布林索引選擇行。

示例 3:使用布林索引

# Select rows where 'Age' is greater than 30 and only show 'Name' and 'City' columns
subset = df[df['Age'] > 30][['Name', 'City']]
print(subset)

結論

Pandas 透過提供僅選擇具有特定列的少量行的選項,為資料操作和分析提供了靈活的工具包。無論您是在進行探索性資料分析還是準備機器學習的資料,理解如何有效地選擇資料都至關重要。

請記住,您可以使用 Pandas 執行的操作遠不止這些示例中所示的操作。該庫的廣泛功能遠遠超出此範圍,允許執行更復雜的資料處理和分析任務。

提出正確的問題並瞭解如何從更大的資料集中提取正確的資料子集對於進行良好的資料分析至關重要。藉助 pandas,您可以做到這一點!

更新於: 2023-07-18

113 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

立即開始
廣告

© . All rights reserved.