Maison >développement back-end >Tutoriel Python >Comment extraire la première ligne de chaque groupe dans un DataFrame Pandas ?
Dans ce contexte, vous disposez d'un Pandas DataFrame avec des données groupées et souhaitez extraire la première ligne de chaque groupe. Ceci peut être réalisé par diverses méthodes.
Une approche simple consiste à utiliser la fonction first(), qui récupère la première valeur non nulle de chaque colonne :
df.groupby('id').first()
Cette méthode exclut la colonne d'index de la sortie. Pour inclure la colonne id en tant que colonne, utilisez reset_index() :
df.groupby('id').first().reset_index()
Vous pouvez également utiliser head(n) pour obtenir les n premières lignes de chaque groupe :
df.groupby('id').head(2).reset_index(drop=True)
Dans cet exemple, le paramètre drop=True supprime la colonne d'index de réinitialisation de la sortie.
Une autre approche consiste à définir le paramètre as_index dans groupby() :
df.groupby('id', as_index=False).nth(0)
Cette méthode inclut l'identifiant en tant que colonne par défaut.
N'oubliez pas d'ajuster ces méthodes en fonction de vos exigences spécifiques en matière d'inclusion de colonnes et du nombre de lignes à récupérer.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!