Pandas 中根據指定列選擇有限行
Pandas 是一個 Python 包,現在已成為全球資料科學家和分析師的首選工具。從資料框中選擇行和列是其眾多資料操作和分析功能之一。本文以實際示例探討了如何使用 Pandas 選擇具有特定列的一組行。
雖然我們強調了 Pandas 的一個特定功能,但請記住,該庫的功能遠不止於此,使其成為資料處理的關鍵工具。
Pandas DataFrame:簡介
對於 Python,Pandas 提供了一種快速、使用者友好的資料結構(DataFrame)和資料分析工具。“Pandas”這個名稱來源於計量經濟學中使用的術語“面板資料”,指的是包含多個時間段內相同人員的觀察結果的資料集。
在 Pandas 中根據指定列選擇有限行
在資料分析中,經常需要從 DataFrame 中選擇特定的行和列。在您只對分析或修改完整資料集的一部分感興趣的情況下,這可能很有幫助。以下是一些使用 Pandas 庫從一組列中選擇有限數量的行的方法
方法 1:使用 iloc 和 loc 方法
可以分別根據其整數索引和標籤使用 iloc 和 loc 方法選擇行和列。
示例 1:使用 iloc
import pandas as pd
# Create a simple dataframe
data = {
'Name': ['John', 'Anna', 'Peter', 'Linda', 'Mike'],
'Age': [28, 24, 35, 32, 30],
'City': ['New York', 'Paris', 'Berlin', 'London', 'Sydney']
}
df = pd.DataFrame(data)
# Select the first three rows from the 'Name' and 'Age' columns
subset = df.iloc[:3, [0, 1]]
print(subset)
輸出
Name Age 0 John 28 1 Anna 24 2 Peter 35
示例 2:使用 loc
# Select the first three rows from the 'Name' and 'Age' columns subset = df.loc[:2, ['Name', 'Age']] print(subset)
方法 2:使用布林索引
您可以根據 DataFrame 的實際值使用布林索引選擇行。
示例 3:使用布林索引
# Select rows where 'Age' is greater than 30 and only show 'Name' and 'City' columns subset = df[df['Age'] > 30][['Name', 'City']] print(subset)
結論
Pandas 透過提供僅選擇具有特定列的少量行的選項,為資料操作和分析提供了靈活的工具包。無論您是在進行探索性資料分析還是準備機器學習的資料,理解如何有效地選擇資料都至關重要。
請記住,您可以使用 Pandas 執行的操作遠不止這些示例中所示的操作。該庫的廣泛功能遠遠超出此範圍,允許執行更復雜的資料處理和分析任務。
提出正確的問題並瞭解如何從更大的資料集中提取正確的資料子集對於進行良好的資料分析至關重要。藉助 pandas,您可以做到這一點!
廣告
資料結構
網路
關係型資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP