使用Python Pandas庫的優勢有哪些?
首先,我們可以說它擁有各種工具來支援將資料載入到資料物件(pandas DataFrame和Series)中,而不管其檔案格式如何。這意味著我們可以使用任何pandas輸入函式讀取任何檔案格式的表格資料。一些pandas輸入函式的列表包括read_table、read_csv、read_html、read_excel、read_json、read_orc、read_sql等等。
示例
df = pd.read_table('file.txt',sep=' ')
df解釋
在上例中,我們有一個包含表格資料的文字檔案,資料以空格(列之間)分隔。在這裡,我們使用此read_table方法和關鍵字引數sep建立了一個DataFrame。關鍵字引數sep的輸入是空格(“ ”),因為此文字檔案中的資料僅以空格分隔。
輸出
column1 column2 0 1 2 1 3 4 2 5 6
以上輸出是儲存在pandas資料物件(DataFrame物件)df中的資料,它來自我們的文字檔案“file.txt”的表格資料。
同樣,在這個pandas庫中,我們還有各種可用的功能,例如:
我們可以自定義已索引DataFrame物件的表索引。
我們可以重塑DataFrame物件中的資料,以從資料表中獲取更多資訊。要重塑DataFrame,我們可以使用許多方法,例如pivot、melt等等。
我們可以使用pandas資料物件的基於標籤的分片技術來分片資料。可以透過範圍、loc和iloc方法完成。
示例
Series[:2]
解釋
在上例中,我們得到了一組分片的pandas Series物件,我們使用分片範圍對我們的pandas資料物件(Series物件)進行了操作。
並且我們可以高效地合併高效能資料集(多個DataFrame)。
它支援時間序列功能,以便我們可以處理與日期和時間相關的資料。
pandas包包含多種方法,方便進行資料過濾操作。
同樣,在這個pandas包中,我們還有更多功能可用於處理Python中的任何形式的資料。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP