Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich mehrere CSV-Dateien in einem einzigen Pandas-DataFrame in Python kombinieren?
Das Ziel dieser Aufgabe besteht darin, mehrere CSV-Dateien aus einem Verzeichnis in einen einzelnen Pandas-DataFrame zu importieren. So erreichen Sie dies:
Importieren Sie zunächst die erforderlichen Bibliotheken für die Dateiverwaltung und Datenbearbeitung:
import pandas as pd import glob import os
Um die CSV-Dateien zu lesen und zu verketten, befolgen Sie diese Schritte:
Hier ist ein Beispielcode, der diese Schritte kombiniert:
# Get file names path = r"C:\DRO\DCL_rawdata_files" filenames = glob.glob(os.path.join(path, "*.csv")) dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename, header=0)) # Concatenate data into one DataFrame big_frame = pd.concat(dfs, ignore_index=True)
Um zwischen Daten von verschiedenen zu unterscheiden Bei CSV-Dateien können Sie eine neue Spalte hinzufügen, um jede Datei zu identifizieren. Hier sind einige Optionen dafür:
Option 1: Dateinamen als Spalte hinzufügen
for df in dfs: df["file_name"] = df.file_name.str.split("\").str[-1].str.split(".")[0]
Option 2: Dateiquelle als hinzufügen Spalte
df["Source"] = np.repeat([f"File{i}" for i in range(len(dfs))], [len(df) for df in dfs])
Indem Sie diese Schritte befolgen, können Sie mehrere CSV-Dateien effizient importieren Dateien in einem einzigen zusammenhängenden DataFrame in Python, was die Analyse und Verarbeitung von Daten aus verschiedenen Quellen erleichtert.
Das obige ist der detaillierte Inhalt vonWie kann ich mehrere CSV-Dateien in einem einzigen Pandas-DataFrame in Python kombinieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!