Maison >développement back-end >Tutoriel Python >Comment regrouper les lignes Pandas DataFrame et convertir les valeurs de colonne en listes ?
Comment convertir des lignes de dataframe en listes dans Pandas GroupBy
Lors de la manipulation de dataframes dans Pandas, il peut être nécessaire de transformer les données en un fichier spécifique format pour une analyse plus approfondie. Une façon de procéder consiste à regrouper les lignes par une colonne spécifiée et à créer des listes à partir d'une autre colonne au sein de chaque groupe.
Dans ce scénario, nous recevons une trame de données contenant deux colonnes : "a" (nom de la colonne) et 'b' (valeurs de colonne). La tâche consiste à transformer ce dataframe en un nouveau dataframe où chaque valeur unique de la colonne « a » a ses valeurs correspondantes de la colonne « b » regroupées dans une liste.
Pour y parvenir :
df1 = df.groupby('a')['b'].apply(list).reset_index(name='new')
Dans ce code :
Le résultat final est un nouveau dataframe, df1, avec les valeurs uniques de la colonne « a » dans la colonne « a » et les listes correspondantes de la colonne « b » dans la colonne « nouveau ».
Voici un exemple pour illustrer :
Étant donné le dataframe suivant :
a | b |
---|---|
A | 1 |
A | 2 |
B | 5 |
B | 5 |
B | 4 |
C | 6 |
L'application du code susmentionné le transformera dans :
a | new |
---|---|
A | [1, 2] |
B | [5, 5, 4] |
C | [6] |
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!