Maison >développement back-end >Tutoriel Python >Voici quelques options de titre, chacune mettant en évidence un aspect différent de la solution : Se concentrer sur le problème : * Comment traiter de grandes DataFrames Pandas sans erreurs de mémoire ? * Erreur de mémoire dans Pandas :

Voici quelques options de titre, chacune mettant en évidence un aspect différent de la solution : Se concentrer sur le problème : * Comment traiter de grandes DataFrames Pandas sans erreurs de mémoire ? * Erreur de mémoire dans Pandas :

Patricia Arquetteoriginal: 2024-10-27 06:19:29942parcourir

Here are a few title options, each highlighting a different aspect of the solution:

Focusing on the Problem:

* How to Process Large Pandas DataFrames Without Memory Errors?
* Memory Error in Pandas: Efficiently Handling Large Dataframes?

Focusing on t

Découpage de grandes trames de données Pandas

Problème :

Tentatives de transmission d'une grande trame de données à travers un la fonction entraîne une erreur de mémoire, ce qui suggère que la taille de la trame de données est excessive. L'objectif est de :

Découper la trame de données en segments plus petits.
Parcourir des morceaux plus petits au sein de la fonction.
Consolider les segments traités en une seule trame de données.

Solution :

Découpage par nombre de lignes

Le fractionnement selon un nombre de lignes fixe peut être effectué à l'aide d'une liste compréhension ou array_split de numpy :

<code class="python">n = 200000  # Chunk row size
list_df = [df[i:i + n] for i in range(0, df.shape[0], n)]</code>

<code class="python">list_df = np.array_split(df, math.ceil(len(df) / n))</code>

Découpage par AcctName

Pour découper en fonction d'une valeur de colonne spécifique, telle que AcctName :

<code class="python">list_df = []

for n, g in df.groupby('AcctName'):
    list_df.append(g)</code>

Consolidation

Une fois le grand dataframe découpé, il peut être réassemblé à l'aide de pd.concat :

<code class="python">consolidated_df = pd.concat(list_df)</code>

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

numpy pandas count Error using function column

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Comment créer un point de terminaison FastAPI qui accepte soit le formulaire, soit le corps JSON ?Article suivant：Comment créer un point de terminaison FastAPI qui accepte soit le formulaire, soit le corps JSON ?

Articles Liés

Voir plus