Maison  >  Article  >  développement back-end  >  Fichiers HDF5 en Python

Fichiers HDF5 en Python

王林
王林avant
2023-09-15 13:41:02980parcourir

Fichiers HDF5 en Python

Le type de fichier HDF5 (Hierarchical Data Format 5) est souvent utilisé pour stocker et traiter des ensembles de données volumineux et complexes. Il est parfait pour les utilisations scientifiques et industrielles car il est polyvalent, évolutif et efficace. Python est l'un des nombreux langages de programmation pouvant être utilisés pour générer, lire et modifier des fichiers HDF5. Dans ce didacticiel, nous allons vous montrer comment travailler avec des fichiers HDF5 en Python.

Installation et configuration

Nous devons installer le package "h5py". Nous pouvons l’installer à l’aide du pip du programme d’installation du package Python.

pip install h5py

Grammaire

Pour créer des fichiers HDF5 en Python, nous devons d'abord créer une instance de la classe "h5py.File". Nous pouvons ensuite utiliser cette instance pour créer et manipuler des ensembles de données et des groupes dans le fichier.

import h5py
file = h5py.File("filename.hdf5", "w")

Algorithme

Importerh5pymodule

  • L'objet h5py doit être créé en utilisant l'en-tête et le mode du type de fichier ("w" pour l'écriture, "r" pour la lecture)

  • Utilisez les fonctions "Créer un ensemble de données" et "Créer un groupe" pour créer des ensembles de données et des groupes dans des fichiers.

  • Remplissez l'ensemble de données en utilisant la notation de tableau NumPy typique.

  • Utilisez la technique "Fermer" pour libérer de la mémoire objet et vider les données dans le fichier.

Exemple

Créez des fichiers HDF5 à l'aide d'un seul ensemble de données

import h5py

# Create a new HDF5 file
file = h5py.File("example.hdf5", "w")

# Create a dataset
dataset = file.create_dataset("data", shape=(10,), dtype='i')

# Write data to the dataset
for i in range(10):
   dataset[i] = i

# Close the file
file.close()

Importez d’abord le package h5py installé. Créez un nouveau fichier HDF5 nommé "exemple.hdf5" avec des autorisations en écriture. Ensuite, créez une collection appelée "data", qui a la forme (10,) et le type de données est entier. Nous utilisons ensuite une boucle pour mettre des nombres compris entre 0 et 9 dans l'ensemble de données. Pour éviter les fuites de mémoire et garantir que toutes les données ont été validées dans le fichier, nous les supprimons à la fin. Ce code montre comment utiliser le module Python h5py pour créer un nouveau fichier HDF5, un ensemble de données et y ajouter des données.

Lire les données des fichiers HDF5 existants

import h5py
import numpy as np

# Open an existing HDF5 file
file = h5py.File("example.hdf5", "r")

# Read the dataset into a NumPy array
dataset = file["data"]
data = np.array(dataset)

# Close the file
file.close()

# Print the data
print(data)

Sortie

[0 1 2 3 4 5 6 7 8 9]

Cela lira le fichier example.hdf5 créé dans l'exemple précédent, le décryptera et l'imprimera sur la console.

Conclusion

Un format de fichier puissant pour enregistrer et distribuer de grands ensembles de données est appelé HDF5. Il fournit un cadre en couches pour l'organisation des données et prend en charge le regroupement et la compression pour un stockage efficace. Le module h5py fournit une API facile à comprendre pour générer, lire et écrire des fichiers HDF5, permettant à HDF5 d'être facilement incorporé dans les applications Python. HDF5 est un outil utile pour quiconque travaille avec des fichiers volumineux en Python en raison de ses nombreuses utilisations.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer