Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ein DataFrame mit einer Million Zeilen nach Teilnehmer effizient in kleinere DataFrames aufgeteilt werden?

Wie kann ein DataFrame mit einer Million Zeilen nach Teilnehmer effizient in kleinere DataFrames aufgeteilt werden?

Susan SarandonOriginal: 2024-12-03 01:31:11399Durchsuche

How to Efficiently Split a Million-Row DataFrame into Smaller DataFrames by Participant?

DataFrame in mehrere DataFrames aufteilen

Beim Umgang mit riesigen Datensätzen kann es für eine effiziente Verarbeitung erforderlich sein, diese in kleinere Teile aufzuteilen. Dies kann erreicht werden, indem der DataFrame anhand einer eindeutigen Kennung aufgeteilt wird, was zu mehreren kleineren DataFrames führt. In diesem Fall besteht das Ziel darin, einen DataFrame mit einer Million Zeilen in 60 kleinere DataFrames zu unterteilen, einen für jeden Teilnehmer, der durch die Variable „Name“ identifiziert wird.

Leider schlägt der bereitgestellte Python-Code zum Aufteilen des DataFrames fehl Schließe die Aufgabe ab. Anstatt auf unbestimmte Zeit zu laufen, wird ein alternativer Ansatz empfohlen, der die Slicing- und Indexierungsfunktionen von Pandas nutzt. Hier ist der geänderte Code:

import pandas as pd

# Create a list of unique participant names
unique_names = data['name'].unique()

# Create a dictionary to store the DataFrames for each participant
participant_data = {name: pd.DataFrame() for name in unique_names}

# Populate the dictionary with sliced DataFrames for each participant
for name in unique_names:
    participant_data[name] = data[data['name'] == name]

Dieser Code unterteilt den DataFrame effizient auf der Grundlage der Spalte „Name“, erstellt separate DataFrames für jeden Teilnehmer und vermeidet gleichzeitig die Fallstricke des vorherigen Codes.

Das obige ist der detaillierte Inhalt vonWie kann ein DataFrame mit einer Million Zeilen nach Teilnehmer effizient in kleinere DataFrames aufgeteilt werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Python pandas for while this column

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Wie kann ich Bilder mit OpenCV und NumPy Slicing in Python effizient zuschneiden?Nächster Artikel：Wie kann ich Bilder mit OpenCV und NumPy Slicing in Python effizient zuschneiden?

In Verbindung stehende Artikel

Mehr sehen