Heim >Backend-Entwicklung >Python-Tutorial >Wie teile ich einen großen Pandas-DataFrame in gleiche Teile auf?
Aufteilen eines großen Pandas-Datenrahmens
Stellen Sie sich einen großen Pandas-Datenrahmen vor, der aus 423244 Zeilen besteht. Es besteht die Notwendigkeit, diesen DataFrame in vier gleiche Teile zu unterteilen. Ein Versuch mit np.split(df, 4) löst jedoch den Fehler „ValueError: Array-Split führt nicht zu gleicher Teilung“ aus.
Um dieses Problem zu beheben, sollte np.array_split verwendet werden. Im Gegensatz zu np.split ermöglicht np.array_split, dass indices_or_sections eine ganze Zahl ist, die keine gleiche Achsenteilung erzeugt.
<code class="python">import pandas as pd import numpy as np # Create a DataFrame df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.random.randn(8), 'D': np.random.randn(8)}) # Split the DataFrame into three equal parts result = np.array_split(df, 3) # Print the results for i in range(len(result)): print(f"Part {i + 1}:") print(result[i]) print()</code>
Dieser Code teilt den DataFrame in drei ungefähr gleiche Teile. Die Anzahl der Teile kann je nach Bedarf angepasst werden.
Das obige ist der detaillierte Inhalt vonWie teile ich einen großen Pandas-DataFrame in gleiche Teile auf?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!