Maison >développement back-end >Tutoriel Python >Comment ajouter efficacement plusieurs DataFrames dans une boucle For en Python ?
Ajout de plusieurs DataFrames dans une boucle For en Python
Lorsque vous travaillez avec de grands ensembles de données stockés dans plusieurs fichiers Excel, il est souvent nécessaire de consolider toutes les données dans un seul DataFrame pour une analyse ou un traitement ultérieur. Cela peut être réalisé sans effort en utilisant la bibliothèque pandas de Python dans une boucle for.
Pour ajouter des dataframes, il est important de noter que la méthode DataFrame.append() nécessite au moins deux arguments. Dans le code fourni, un seul argument, data, est transmis. L'approche correcte consiste à stocker tous les DataFrames dans une liste au sein de la boucle, puis à utiliser pd.concat pour fusionner la liste en un seul DataFrame.
Voici une explication détaillée :
<code class="python">import pandas as pd import glob # Initialize an empty list to store DataFrames appended_data = [] # Iterate over Excel files in a specified directory for infile in glob.glob("*.xlsx"): print("Processing file:", infile) # Read data from Excel file into a DataFrame data = pd.read_excel(infile) # Append DataFrame to the list appended_data.append(data) # Concatenate DataFrames to create a consolidated DataFrame final_df = pd.concat(appended_data, ignore_index=True) # Save consolidated data to a new Excel file final_df.to_excel('appended.xlsx', index=False)</code>
En suivant cette approche, vous pouvez ajouter de manière transparente plusieurs DataFrames générés dans une boucle for et enregistrer les données consolidées dans un nouveau fichier Excel. Cela vous permet de travailler avec des ensembles de données volumineux et disjoints de manière efficace et efficiente.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!