Python 中的 HDF5 檔案
檔案型別HDF5(分層資料格式 5)常用於儲存和處理大型複雜資料集。它專為通用性、可擴充套件性和效率而設計,是科學和工業應用的理想選擇。Python 是眾多可用於建立、讀取和修改 HDF5 檔案的程式語言之一。在本教程中,我們將探討在 Python 中使用 HDF5 檔案。
安裝和設定
我們需要安裝“h5py”包。我們可以使用 pip(Python 的包安裝程式)來安裝它。
pip install h5py
語法
要在 Python 中建立 HDF5 檔案,我們首先需要建立一個“h5py.File”類的例項。然後,我們可以使用此例項在檔案中建立和操作資料集和組。
import h5py
file = h5py.File("filename.hdf5", "w")
演算法
匯入h5py模組
使用檔名和檔案模式建立 h5py 物件(“w”表示寫入,“r”表示讀取)
使用“建立資料集”和“建立組”函式在檔案中建立資料集和組。
使用標準NumPy陣列表示法用資料填充資料集。
使用“關閉”方法釋放物件記憶體,並將資料重新整理到檔案。
示例
建立包含單個數據集的 HDF5 檔案
import h5py
# Create a new HDF5 file
file = h5py.File("example.hdf5", "w")
# Create a dataset
dataset = file.create_dataset("data", shape=(10,), dtype='i')
# Write data to the dataset
for i in range(10):
dataset[i] = i
# Close the file
file.close()
首先匯入已安裝的 h5py 包。建立一個名為“example.hdf5”的新 HDF5 檔案,並具有寫入許可權。然後,建立一個名為“data”的資料集,其形狀為 (10,) 且資料型別為整數。然後,我們使用迴圈將數字 0 到 9 放入資料集。最後,我們關閉它,以防止記憶體洩漏並確保所有資料都已提交到檔案。此程式碼演示瞭如何使用 Python h5py 模組建立新的 HDF5 檔案、資料集以及向其中新增資料。
從現有的 HDF5 檔案讀取資料
import h5py
import numpy as np
# Open an existing HDF5 file
file = h5py.File("example.hdf5", "r")
# Read the dataset into a NumPy array
dataset = file["data"]
data = np.array(dataset)
# Close the file
file.close()
# Print the data
print(data)
輸出
[0 1 2 3 4 5 6 7 8 9]
這將讀取在前面的示例中建立的example.hdf5檔案,對其進行解碼並將其列印到控制檯。
結論
HDF5 是一種強大的檔案格式,用於儲存和分發大型資料集。它提供了一個用於資料組織的分層結構,並支援分塊和壓縮以實現高效儲存。透過h5py模組,它提供了一個簡單易懂的 API 用於建立、讀取和寫入 HDF5 檔案,因此 HDF5 可以輕鬆地整合到 Python 應用程式中。由於其多功能性,HDF5 對於處理 Python 中大型檔案的任何人來說都是一項寶貴的資產。
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP