Maison >développement back-end >Tutoriel Python >Comment extraire la première ligne de chaque groupe dans un DataFrame Pandas ?

Comment extraire la première ligne de chaque groupe dans un DataFrame Pandas ?

Susan Sarandon
Susan Sarandonoriginal
2024-11-10 06:34:02929parcourir

How to Extract the First Row of Each Group in a Pandas DataFrame?

Pandas DataFrame : obtenir la première ligne de chaque groupe

Dans ce contexte, vous disposez d'un Pandas DataFrame avec des données groupées et souhaitez extraire la première ligne de chaque groupe. Ceci peut être réalisé par diverses méthodes.

Une approche simple consiste à utiliser la fonction first(), qui récupère la première valeur non nulle de chaque colonne :

df.groupby('id').first()

Cette méthode exclut la colonne d'index de la sortie. Pour inclure la colonne id en tant que colonne, utilisez reset_index() :

df.groupby('id').first().reset_index()

Vous pouvez également utiliser head(n) pour obtenir les n premières lignes de chaque groupe :

df.groupby('id').head(2).reset_index(drop=True)

Dans cet exemple, le paramètre drop=True supprime la colonne d'index de réinitialisation de la sortie.

Une autre approche consiste à définir le paramètre as_index dans groupby() :

df.groupby('id', as_index=False).nth(0)

Cette méthode inclut l'identifiant en tant que colonne par défaut.

N'oubliez pas d'ajuster ces méthodes en fonction de vos exigences spécifiques en matière d'inclusion de colonnes et du nombre de lignes à récupérer.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn