Maison >développement back-end >Tutoriel Python >Comment puis-je accéder à des feuilles de calcul Excel spécifiques sans recharger l'intégralité du fichier à l'aide de Pandas ?
Accéder à des feuilles de calcul spécifiques dans un classeur Excel sans recharger le fichier entier avec Pandas
Lorsque vous traitez des fichiers Excel volumineux, le chargement peut être inefficace l'intégralité du classeur plusieurs fois lorsque seules quelques feuilles de calcul sont nécessaires. Grâce à la fonction pd.read_excel(), il est possible de charger sélectivement des feuilles de calcul spécifiques sans recharger l'intégralité du fichier.
Pour y parvenir, envisagez d'exploiter la classe pd.ExcelFile. Voici comment procéder :
import pandas as pd # Create an instance of pd.ExcelFile xls = pd.ExcelFile('path_to_file.xls') # Read sheet1 and sheet2 from the Excel file df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
Dans ce scénario, l'intégralité du fichier Excel n'est chargé qu'une seule fois lors de l'appel ExcelFile(). Par la suite, chaque appel à pd.read_excel() cible une feuille spécifique, évitant ainsi des rechargements inutiles.
Il est important de noter que l'argument sheet_name dans pd.read_excel() accepte une plage de valeurs : le nom de la feuille, son index (par exemple, 0, 1...), une liste de noms de feuilles ou d'index, ou Aucun. Si une liste est fournie, un dictionnaire avec les noms/index de feuilles comme clés et les trames de données correspondantes comme valeurs est renvoyé. Le comportement par défaut consiste à récupérer la première feuille (sheet_name=0).
En utilisant None comme sheet_name, toutes les feuilles du classeur peuvent être chargées en tant que dictionnaire {sheet_name: dataframe}. Cette approche est idéale lorsqu'il est nécessaire d'accéder à plusieurs feuilles, éliminant ainsi le besoin de chargements répétés de fichiers.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!