使用 Pandas 讀取 CSV 檔案時如何跳過行


Python 內建了一個名為 read_csv 的方法,可用於在使用 Pandas 讀取 CSV 檔案時設定跳過行。CSV 代表逗號分隔值,是包含資料庫的副檔名。此技術可用於任何涉及從 CSV 檔案讀取和處理資料的應用程式。各種應用例如資料過濾、Excel 工具等。

語法

以下語法在示例中使用:

read_csv('file_name.csv', skiprows= set the condition according to user choice)

這是 pandas 模組的內建函式,可以讀取 CSV 檔案的資料。它接受兩個引數:

  • filename.csv - csv 是副檔名的簡單表示形式。

  • skiprows - 此引數允許使用者根據跳過/移除行的條件進行設定。

示例 1

在以下示例中,我們將從匯入名為 pandas 的模組並將其引用物件作為 pd 開始程式。然後初始化名為 df 的變數,該變數透過內建方法 read_csv() 儲存值,該方法接受兩個引數 - demo.csv(檔名)和 skiprows(設定特定索引行)。skiprows 使用列表推導式設定行。最後,我們僅使用變數 df 以表格形式獲取資料。

#skip multiple rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=[1,5,12])
df

輸出

示例 2

在以下示例中,我們將展示如何跳過資料中的單行。首先,匯入有助於設定讀取資料操作的 pandas 模組。將 pd 作為物件引用,用於與 read_csv 賦值。透過使用此內建函式,它接受兩個引數 - 'demo.csv'(檔名)和 skiprows(設定為值 1,從表中刪除第一行)。

#skip only single rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=1)
df

輸出

示例 3

在以下示例中,我們將首先匯入可用於處理其名為 pd 的物件引用的 pandas 模組。接下來,我們將值儲存為內建方法 read_csv 與 pd 一起使用,它接受兩個引數 - 'demo.csv'(檔名)和 skiprows(設定偶數條件的值)。最後,使用變數 df 獲取輸出。

# skip rows based on even condition
import pandas as pd
df = pd.read_csv('demo.csv', skiprows=lambda x:x%2!=0)
# print the months in even order  
df

輸出

示例 4

在以下示例中,透過匯入名為 pandas 的模組開始程式。然後使用內建方法 read_csv 設定兩個引數 - 'demo.csv'(檔名)和 skiprows(將值設定為 lamda x:x>5,僅設定前五行)。接下來,使用變數 df 獲取 5 行的資料。

# skip rows based on certain rows
import pandas as pd
df = pd.read_csv('demo.csv', skiprows= lambda x:x>5)
df

輸出

示例 5

在以下示例中,程式從 pandas 模組開始並將其物件引用設定為 pd。然後初始化名為 df 的變數,該變數透過使用內建方法儲存值,它接受三個引數 - 'demo.csv'(檔名)、skiprows(在列表中設定值整數 2 和 10 以刪除表中的資料)和 nrows(設定值為 10,表示僅有 10 行可用)。

import pandas as pd
df = pd.read_csv('demo.csv', skiprows=[2,10],nrows=10)
df

輸出

結論

我們討論了 skiprows 的概念,並對其應用了各種條件。我們對 skiprows 條件使用了跳過單行、跳過多行、基於偶數條件跳過行、基於某些條件跳過行以及從 CSV 檔案跳過特定行。

更新於:2023年7月17日

2K+ 次瀏覽

啟動你的 職業生涯

透過完成課程獲得認證

開始學習
廣告
© . All rights reserved.