Maison >développement back-end >Tutoriel Python >Comment combiner des DataFrames Pandas générés dans une boucle For : une solution complète

Comment combiner des DataFrames Pandas générés dans une boucle For : une solution complète

Barbara Streisand
Barbara Streisandoriginal
2024-10-30 14:01:02428parcourir

How to Combine Pandas DataFrames Generated in a For Loop: A Comprehensive Solution

Combiner des DataFrames Pandas générés dans une boucle For : une solution complète

En matière de manipulation de données, Pandas propose un ensemble d'outils puissants pour travailler avec des données structurées. Une tâche courante consiste à combiner des données provenant de plusieurs sources. Une façon d'y parvenir consiste à générer des trames de données dans une boucle for, puis à les ajouter pour créer une trame de données unifiée.

Pour ajouter des trames de données générées dans une boucle for, vous devrez utiliser une approche légèrement différente de celle celui que vous avez essayé. Le code que vous avez fourni :

appended_data = pandas.DataFrame.append(data) # requires at least two arguments

nécessite au moins deux trames de données comme arguments, ce qui ne convient pas pour ajouter plusieurs trames de données une par une. Au lieu de cela, nous pouvons utiliser pd.concat pour fusionner une liste de trames de données en une seule trame de données plus grande.

Voici une solution améliorée :

<code class="python">appended_data = []
for infile in glob.glob("*.xlsx"):
    data = pandas.read_excel(infile)
    # Store each dataframe in a list
    appended_data.append(data)
# Concatenate the list of dataframes into a single dataframe
appended_data = pd.concat(appended_data)
# Write the resulting dataframe to a new Excel file
appended_data.to_excel('appended.xlsx')</code>

Dans ce code révisé :

  1. Nous créons une liste vide appended_data pour stocker des trames de données individuelles.
  2. Dans la boucle, nous lisons chaque fichier Excel dans une trame de données et l'ajoutons à cette liste.
  3. En utilisant pd. concat, nous fusionnons toutes les trames de données de la liste en une seule trame de données nommée appended_data.
  4. Enfin, nous écrivons la trame de données ajoutée dans un nouveau fichier Excel nommé "appended.xlsx".

Cette approche garantit que toutes les trames de données générées dans la boucle sont combinées en une seule trame de données, vous fournissant ainsi un ensemble de données unifié.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn