Maison >développement back-end >Tutoriel Python >Comment diviser un DataFrame Pandas en plusieurs DataFrames en fonction des valeurs uniques d'une colonne ?

Comment diviser un DataFrame Pandas en plusieurs DataFrames en fonction des valeurs uniques d'une colonne ?

Susan Sarandon
Susan Sarandonoriginal
2024-12-12 15:29:11788parcourir

How to Split a Pandas DataFrame into Multiple DataFrames Based on a Column's Unique Values?

Diviser un DataFrame Pandas en fonction des valeurs de colonne à l'aide de Groupby

Cet article présente une solution au défi de diviser un DataFrame en plusieurs parties en fonction sur des valeurs uniques dans une colonne spécifique.

Considérez ce qui suit DataFrame :

import pandas as pd

df = pd.DataFrame({
    "N0_YLDF": [6.286333, 6.317000, 6.324889, 6.320667, 6.325556, 6.359000, 6.359000, 6.361111, 6.360778, 6.361111],
    "ZZ": [2, 6, 6, 5, 5, 6, 6, 7, 7, 6],
    "MAT": [11.669069, 11.669069, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454]
})

L'objectif est de créer un nouveau DataFrame comportant plusieurs colonnes pour la colonne "N0_YLDF", chaque colonne correspondant à une valeur unique dans la colonne "ZZ". Pour y parvenir, nous pouvons utiliser la fonction groupby().

grouped_df = df.groupby("ZZ")

La fonction groupby() crée un objet pandas.core.groupby.groupby.DataFrameGroupBy, qui représente le DataFrame avec les groupes répartis selon les valeurs dans la colonne spécifiée. Dans ce cas, nous avons quatre groupes :

print(grouped_df.groups)

# Output
{2: [0], 6: [1, 2, 5, 6, 9], 5: [3, 4], 7: [7, 8]}

Pour obtenir les DataFrames individuels pour chaque groupe, nous pouvons utiliser la compréhension de liste :

split_dfs = [grouped_df.get_group(key) for key in grouped_df.groups]

La méthode get_group() renvoie un DataFrame qui contient les lignes appartenant au groupe spécifié.

La liste split_dfs résultante contient quatre DataFrames, chacun représentant une valeur différente dans le Colonne "ZZ".

Par exemple, pour accéder au DataFrame du groupe avec la valeur "ZZ" de 6, vous pouvez utiliser :

split_df_6 = split_dfs[1]

Cela vous donnera un DataFrame avec le lignes suivantes :

   N0_YLDF   ZZ        MAT
1  6.317000   6  11.669069
2  6.324889   6  11.516454
5  6.359000   6  11.516454
6  6.359000   6  11.516454
9  6.361111   6  11.516454

En utilisant la fonction groupby() et la méthode get_group(), vous pouvez diviser efficacement un DataFrame en plusieurs parties en fonction des valeurs dans une colonne spécifiée.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn