Maison >développement back-end >Tutoriel Python >Comment puis-je charger efficacement des feuilles spécifiques à partir d'un fichier Excel à l'aide de Pandas ?
Sélection de feuilles spécifiques pour le chargement de données Excel avec Pandas pd.read_excel()
Lorsque vous travaillez avec des classeurs Excel multi-feuilles en Python, il est on souhaite souvent charger uniquement des feuilles spécifiques dans un Pandas DataFrame sans recharger l'intégralité du fichier. Cela peut permettre un gain de temps de traitement important, notamment pour les classeurs volumineux.
Grâce à la fonction pd.read_excel(), il est possible de spécifier la ou les feuilles à charger. Ceci est réalisé en spécifiant le paramètre sheet_name comme une chaîne (nom de la feuille), un entier (index de feuille), une liste de noms/indices de feuille ou Aucun.
L'option pour spécifier sheet_name=None est particulièrement utile lorsque plusieurs feuilles doivent être chargées. Dans ce cas, Pandas renvoie un dictionnaire où les clés sont des noms/indices de feuille et les valeurs sont les DataFrames correspondants.
Alternativement, la fonction pd.ExcelFile() peut être utilisée pour ouvrir l'intégralité du classeur en même temps. Cela lit l'intégralité du fichier en mémoire, mais permet de lire plusieurs feuilles sans avoir à recharger le fichier pour chaque feuille.
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
Notez que l'approche pd.ExcelFile() lit l'intégralité du classeur en mémoire. , ce qui n'est peut-être pas idéal pour les très gros classeurs. Dans de tels cas, pd.read_excel() avec la spécification sheet_name appropriée peut être plus efficace.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!