使用Python Pandas庫的優勢有哪些?


首先,我們可以說它擁有各種工具來支援將資料載入到資料物件(pandas DataFrame和Series)中,而不管其檔案格式如何。這意味著我們可以使用任何pandas輸入函式讀取任何檔案格式的表格資料。一些pandas輸入函式的列表包括read_table、read_csv、read_html、read_excel、read_json、read_orc、read_sql等等。

示例

df = pd.read_table('file.txt',sep=' ')
df

解釋

在上例中,我們有一個包含表格資料的文字檔案,資料以空格(列之間)分隔。在這裡,我們使用此read_table方法和關鍵字引數sep建立了一個DataFrame。關鍵字引數sep的輸入是空格(“ ”),因為此文字檔案中的資料僅以空格分隔。

輸出

   column1   column2
0        1         2
1        3         4
2        5         6

以上輸出是儲存在pandas資料物件(DataFrame物件)df中的資料,它來自我們的文字檔案“file.txt”的表格資料。

同樣,在這個pandas庫中,我們還有各種可用的功能,例如:

  • 我們可以自定義已索引DataFrame物件的表索引。

  • 我們可以重塑DataFrame物件中的資料,以從資料表中獲取更多資訊。要重塑DataFrame,我們可以使用許多方法,例如pivot、melt等等。

  • 我們可以使用pandas資料物件的基於標籤的分片技術來分片資料。可以透過範圍、loc和iloc方法完成。

示例

Series[:2]

解釋

在上例中,我們得到了一組分片的pandas Series物件,我們使用分片範圍對我們的pandas資料物件(Series物件)進行了操作。

  • 並且我們可以高效地合併高效能資料集(多個DataFrame)。

  • 它支援時間序列功能,以便我們可以處理與日期和時間相關的資料。

  • pandas包包含多種方法,方便進行資料過濾操作。

同樣,在這個pandas包中,我們還有更多功能可用於處理Python中的任何形式的資料。

更新於:2021年11月18日

309 次瀏覽

開啟您的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.