Heim  >  Artikel  >  Backend-Entwicklung  >  Hier sind einige Titeloptionen, die jeweils einen anderen Aspekt der Lösung hervorheben: Konzentration auf das Problem: * Wie verarbeite ich große Pandas-DataFrames ohne Speicherfehler? * Speicherfehler in Pandas:

Hier sind einige Titeloptionen, die jeweils einen anderen Aspekt der Lösung hervorheben: Konzentration auf das Problem: * Wie verarbeite ich große Pandas-DataFrames ohne Speicherfehler? * Speicherfehler in Pandas:

Patricia Arquette
Patricia ArquetteOriginal
2024-10-27 06:19:29819Durchsuche

Here are a few title options, each highlighting a different aspect of the solution:

Focusing on the Problem:

* How to Process Large Pandas DataFrames Without Memory Errors?
* Memory Error in Pandas:  Efficiently Handling Large Dataframes?

Focusing on t

Slicing Large Pandas Dataframes

Problem:

Versuche, einen großen Datenrahmen durch einen zu leiten Die Funktion führt zu einem Speicherfehler, was darauf hindeutet, dass die Datenrahmengröße zu groß ist. Das Ziel besteht darin:

  1. Den Datenrahmen in kleinere Segmente aufzuteilen.
  2. Durch kleinere Teile innerhalb der Funktion zu iterieren.
  3. Die verarbeiteten Segmente in einem einzigen Datenrahmen zu konsolidieren.

Lösung:

Aufteilen nach Zeilenanzahl

Das Aufteilen nach einer festen Zeilenanzahl kann mithilfe einer Liste erfolgen comprehension oder array_split von numpy:

<code class="python">n = 200000  # Chunk row size
list_df = [df[i:i + n] for i in range(0, df.shape[0], n)]</code>
<code class="python">list_df = np.array_split(df, math.ceil(len(df) / n))</code>

Slicing nach AcctName

Um nach einem bestimmten Spaltenwert zu segmentieren, z. B. AcctName:

<code class="python">list_df = []

for n, g in df.groupby('AcctName'):
    list_df.append(g)</code>

Konsolidierung

Sobald der große Datenrahmen zerlegt wurde, kann er mit pd.concat wieder zusammengesetzt werden:

<code class="python">consolidated_df = pd.concat(list_df)</code>

Das obige ist der detaillierte Inhalt vonHier sind einige Titeloptionen, die jeweils einen anderen Aspekt der Lösung hervorheben: Konzentration auf das Problem: * Wie verarbeite ich große Pandas-DataFrames ohne Speicherfehler? * Speicherfehler in Pandas:. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn