Python pandas 包中的資料結構是什麼?
資料結構是一種收集、組織和儲存資料的方式,其格式使我們能夠以有效的方式訪問和修改資料。它是一組資料型別的集合。它為您提供了一種組織專案(值)的最佳方式,以節省記憶體。
python pandas 包以有效的方式處理資料,因為它具有兩個強大的資料結構,稱為 Series 和 DataFrames。
Series只不過是一個一維帶標籤的陣列,它能夠容納任何資料型別。它可以儲存整數值、字串、浮點數等。Series 中的每個值都分配給一個標籤(分配給一個索引),標籤可以是整數值,也可以是名稱表示。
示例
import pandas as pd data = pd.Series([1,2,3,4,5]) print(data)
解釋
Pandas Series 資料結構是使用一個包含 5 個元素的簡單 python 列表定義的。透過使用 import 關鍵字,我們匯入了 pandas 包,然後我們使用 pandas.Series 函式建立了 Series。
輸出
0 1 1 2 2 3 3 4 4 5 dtype: int64
Series 的輸出在上面的程式碼塊中表示,我們可以觀察到 pandas series 是一個一維物件,它儲存同類資料,並且 Series 中的每個值都由一個標籤表示。對於我們上面的示例,標籤值為 0、1、2、3、4。
pandas 中的另一個數據結構是DataFrame,它是一個二維帶標籤的資料結構,用於以行和列的格式表示。每列中的資料可能具有不同的資料型別。DataFrame 的整體結構類似於電子表格或 SQL 表。與 Series 一樣,DataFrame 行也用標籤表示。
示例
import pandas as pd df = pd.DataFrame([[2,3,4,5],[6,7,8,9]], columns=['a','b','c','d']) print(df)
解釋
在上面的示例中,我們使用列表的列表建立了一個簡單的 pandas DataFrame,並且這裡的列標籤手動定義為 a、b、c、d。
輸出
a b c d 0 2 3 4 5 1 6 7 8 9
pandas DataFrame 的輸出可以在上面的輸出塊中看到,DataFrame 由 2 行 4 列建立,0、1 和 a、b、c、d 分別是行和列標籤。
在 pandas 0.20.0 版本之前,有一個三維資料結構可用,該資料結構稱為面板。在較新版本的 pandas 中,這些面板的三維資料表示為 MultiIndex DataFrame。
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP