Maison >développement back-end >Tutoriel Python >Comment combiner des DataFrames Pandas générés dans une boucle For : une solution complète
Combiner des DataFrames Pandas générés dans une boucle For : une solution complète
En matière de manipulation de données, Pandas propose un ensemble d'outils puissants pour travailler avec des données structurées. Une tâche courante consiste à combiner des données provenant de plusieurs sources. Une façon d'y parvenir consiste à générer des trames de données dans une boucle for, puis à les ajouter pour créer une trame de données unifiée.
Pour ajouter des trames de données générées dans une boucle for, vous devrez utiliser une approche légèrement différente de celle celui que vous avez essayé. Le code que vous avez fourni :
appended_data = pandas.DataFrame.append(data) # requires at least two arguments
nécessite au moins deux trames de données comme arguments, ce qui ne convient pas pour ajouter plusieurs trames de données une par une. Au lieu de cela, nous pouvons utiliser pd.concat pour fusionner une liste de trames de données en une seule trame de données plus grande.
Voici une solution améliorée :
<code class="python">appended_data = [] for infile in glob.glob("*.xlsx"): data = pandas.read_excel(infile) # Store each dataframe in a list appended_data.append(data) # Concatenate the list of dataframes into a single dataframe appended_data = pd.concat(appended_data) # Write the resulting dataframe to a new Excel file appended_data.to_excel('appended.xlsx')</code>
Dans ce code révisé :
Cette approche garantit que toutes les trames de données générées dans la boucle sont combinées en une seule trame de données, vous fournissant ainsi un ensemble de données unifié.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!