Maison >développement back-end >Tutoriel Python >Comment diviser un DataFrame Pandas en plusieurs DataFrames en fonction des valeurs uniques d'une colonne ?
Diviser un DataFrame Pandas en fonction des valeurs de colonne à l'aide de Groupby
Cet article présente une solution au défi de diviser un DataFrame en plusieurs parties en fonction sur des valeurs uniques dans une colonne spécifique.
Considérez ce qui suit DataFrame :
import pandas as pd df = pd.DataFrame({ "N0_YLDF": [6.286333, 6.317000, 6.324889, 6.320667, 6.325556, 6.359000, 6.359000, 6.361111, 6.360778, 6.361111], "ZZ": [2, 6, 6, 5, 5, 6, 6, 7, 7, 6], "MAT": [11.669069, 11.669069, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454] })
L'objectif est de créer un nouveau DataFrame comportant plusieurs colonnes pour la colonne "N0_YLDF", chaque colonne correspondant à une valeur unique dans la colonne "ZZ". Pour y parvenir, nous pouvons utiliser la fonction groupby().
grouped_df = df.groupby("ZZ")
La fonction groupby() crée un objet pandas.core.groupby.groupby.DataFrameGroupBy, qui représente le DataFrame avec les groupes répartis selon les valeurs dans la colonne spécifiée. Dans ce cas, nous avons quatre groupes :
print(grouped_df.groups) # Output {2: [0], 6: [1, 2, 5, 6, 9], 5: [3, 4], 7: [7, 8]}
Pour obtenir les DataFrames individuels pour chaque groupe, nous pouvons utiliser la compréhension de liste :
split_dfs = [grouped_df.get_group(key) for key in grouped_df.groups]
La méthode get_group() renvoie un DataFrame qui contient les lignes appartenant au groupe spécifié.
La liste split_dfs résultante contient quatre DataFrames, chacun représentant une valeur différente dans le Colonne "ZZ".
Par exemple, pour accéder au DataFrame du groupe avec la valeur "ZZ" de 6, vous pouvez utiliser :
split_df_6 = split_dfs[1]
Cela vous donnera un DataFrame avec le lignes suivantes :
N0_YLDF ZZ MAT 1 6.317000 6 11.669069 2 6.324889 6 11.516454 5 6.359000 6 11.516454 6 6.359000 6 11.516454 9 6.361111 6 11.516454
En utilisant la fonction groupby() et la méthode get_group(), vous pouvez diviser efficacement un DataFrame en plusieurs parties en fonction des valeurs dans une colonne spécifiée.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!