Python - 使用 Pandas .query() 方法過濾資料
Pandas 是一個非常廣泛使用的 Python 庫,用於資料清洗、資料分析等。在本文中,我們將瞭解如何使用 query 方法從給定的資料集獲取特定資料。我們可以在查詢中包含單個條件和多個條件。
讀取資料
讓我們首先使用 Pandas 庫將資料讀取到 Pandas 資料框中。下面的程式就是這樣做的。
示例
import pandas as pd # Reading data frame from csv file data = pd.read_csv("D:\heart.csv") print(data)
輸出
執行以上程式碼將得到以下結果:
使用單個條件的查詢
接下來,我們看看如何使用單個條件與 query 方法結合使用。如您所見,僅返回了原始 303 行中的 119 行作為結果。
示例
import pandas as pd # Data frame from csv file data = pd.read_csv("D:\heart.csv") data.query('chol < 230', inplace=True) # Result print(data)
輸出
執行以上程式碼將得到以下結果:
使用多個條件的查詢
與上述方法類似,我們可以將多個條件應用於 query 方法。這將進一步限制結果資料集。當我們還將年齡限制為大於 60 時,現在僅返回 79 行。
示例
import pandas as pd # Data frame from csv file data = pd.read_csv("D:\heart.csv") data.query('chol < 230' and 'age > 60', inplace=True) # Result print(data)
輸出
執行以上程式碼將得到以下結果:
廣告