Python - 使用 Pandas .query() 方法過濾資料


Pandas 是一個非常廣泛使用的 Python 庫,用於資料清洗、資料分析等。在本文中,我們將瞭解如何使用 query 方法從給定的資料集獲取特定資料。我們可以在查詢中包含單個條件和多個條件。

讀取資料

讓我們首先使用 Pandas 庫將資料讀取到 Pandas 資料框中。下面的程式就是這樣做的。

示例

import pandas as pd

# Reading data frame from csv file
data = pd.read_csv("D:\heart.csv")

print(data)

輸出

執行以上程式碼將得到以下結果:

使用單個條件的查詢

接下來,我們看看如何使用單個條件與 query 方法結合使用。如您所見,僅返回了原始 303 行中的 119 行作為結果。

示例

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\heart.csv")

data.query('chol < 230', inplace=True)

# Result
print(data)

輸出

執行以上程式碼將得到以下結果:

使用多個條件的查詢

與上述方法類似,我們可以將多個條件應用於 query 方法。這將進一步限制結果資料集。當我們還將年齡限制為大於 60 時,現在僅返回 79 行。

示例

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\heart.csv")

data.query('chol < 230' and 'age > 60', inplace=True)

# Result
print(data)

輸出

執行以上程式碼將得到以下結果:

更新於: 2020-07-22

2K+ 閱讀量

開啟您的 職業生涯

透過完成課程獲得認證

開始學習
廣告