Heim >Backend-Entwicklung >Python-Tutorial >So kombinieren Sie in einer For-Schleife generierte Pandas-DataFrames: Eine umfassende Lösung

So kombinieren Sie in einer For-Schleife generierte Pandas-DataFrames: Eine umfassende Lösung

Barbara Streisand
Barbara StreisandOriginal
2024-10-30 14:01:02375Durchsuche

How to Combine Pandas DataFrames Generated in a For Loop: A Comprehensive Solution

In einer For-Schleife generierte Pandas-DataFrames kombinieren: Eine umfassende Lösung

Wenn es um Datenmanipulation geht, bietet Pandas eine Reihe leistungsstarker Tools für die Arbeit mit strukturierten Daten. Eine häufige Aufgabe besteht darin, Daten aus mehreren Quellen zu kombinieren. Eine Möglichkeit, dies zu erreichen, besteht darin, Datenrahmen in einer for-Schleife zu generieren und sie dann anzuhängen, um einen einheitlichen Datenrahmen zu erstellen.

Um in einer for-Schleife generierte Datenrahmen anzuhängen, müssen Sie einen etwas anderen Ansatz als den verwenden eine, die du probiert hast. Der von Ihnen bereitgestellte Code:

appended_data = pandas.DataFrame.append(data) # requires at least two arguments

erfordert mindestens zwei Datenrahmen als Argumente, was nicht zum Anhängen mehrerer Datenrahmen nacheinander geeignet ist. Stattdessen können wir pd.concat verwenden, um eine Liste von Datenrahmen zu einem einzigen, größeren Datenrahmen zusammenzuführen.

Hier ist eine verbesserte Lösung:

<code class="python">appended_data = []
for infile in glob.glob("*.xlsx"):
    data = pandas.read_excel(infile)
    # Store each dataframe in a list
    appended_data.append(data)
# Concatenate the list of dataframes into a single dataframe
appended_data = pd.concat(appended_data)
# Write the resulting dataframe to a new Excel file
appended_data.to_excel('appended.xlsx')</code>

In diesem überarbeiteten Code:

  1. Wir erstellen eine leere Liste appended_data, um einzelne Datenrahmen zu speichern.
  2. Innerhalb der Schleife lesen wir jede Excel-Datei in einen Datenrahmen ein und hängen sie an diese Liste an.
  3. Mit pd. concat führen wir alle Datenrahmen in der Liste zu einem einzigen Datenrahmen mit dem Namen „appended_data“ zusammen.
  4. Schließlich schreiben wir den angehängten Datenrahmen in eine neue Excel-Datei mit dem Namen „appended.xlsx“.

Dieser Ansatz stellt sicher, dass alle in der Schleife generierten Datenrahmen in einem einzigen Datenrahmen zusammengefasst werden, sodass Sie einen einheitlichen Datensatz erhalten.

Das obige ist der detaillierte Inhalt vonSo kombinieren Sie in einer For-Schleife generierte Pandas-DataFrames: Eine umfassende Lösung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn