檔案類型HDF5(分層資料格式5)經常用於儲存和處理龐大而複雜的資料集。它是科學和工業用途的完美選擇,因為它具有多功能、可擴展且有效的特點。 Python 是眾多可用於產生、讀取和修改 HDF5 檔案的程式語言之一。在本教程中,我們將介紹如何在 Python 中使用 HDF5 檔案。
我們需要安裝「h5py」套件。我們可以使用 Python 的套件安裝程式 pip 來安裝它。
pip install h5py
要在Python中建立HDF5文件,我們首先需要建立「h5py.File」類別的實例。然後,我們可以使用此實例來建立和操作文件中的資料集和群組。
import h5py file = h5py.File("filename.hdf5", "w")
導入h5py模組
應使用檔案類型中的標題和模式建立 h5py 物件(「w」表示寫入,「r」表示讀取)
#使用「建立資料集」和「建立群組」功能,在檔案內建立資料集和群組。
使用典型的 NumPy 陣列表示法填入資料集。
使用「關閉」技術釋放物件內存,將資料刷新到檔案中。
使用單一資料集建立 HDF5 檔案
import h5py # Create a new HDF5 file file = h5py.File("example.hdf5", "w") # Create a dataset dataset = file.create_dataset("data", shape=(10,), dtype='i') # Write data to the dataset for i in range(10): dataset[i] = i # Close the file file.close()
先導入已安裝的h5py包。建立一個具有寫入權限的新 HDF5 文件,名稱為 “example.hdf5”。然後,建立一個名為「data」的集合,其形式為(10,),資料型態為整數。然後,我們使用循環將 0 到 9 範圍內的數字放入資料集中。為了防止記憶體洩漏並保證所有資料都已提交到文件中,我們在最後將其刪除。此程式碼示範如何使用 Python h5py 模組建立新的 HDF5 檔案、資料集並在其中新增資料。
從現有 HDF5 檔案讀取資料
import h5py import numpy as np # Open an existing HDF5 file file = h5py.File("example.hdf5", "r") # Read the dataset into a NumPy array dataset = file["data"] data = np.array(dataset) # Close the file file.close() # Print the data print(data)
[0 1 2 3 4 5 6 7 8 9]
這將讀取上一個範例中建立的 example.hdf5 文件,對其進行解密並將其列印到控制台。
用於保存和分發大數據集的強大檔案格式稱為 HDF5。它為資料組織提供了分層框架,並支援分塊和壓縮以實現有效儲存。 h5py 模組提供了用於生成、讀取和寫入 HDF5 檔案的簡單易懂的 API,借助該模組,HDF5 可以輕鬆地合併到 Python 應用程式中。對於使用 Python 處理大型檔案的任何人來說,HDF5 是一個有用的工具,因為它具有多種用途。
以上是在Python中的HDF5文件的詳細內容。更多資訊請關注PHP中文網其他相關文章!