Maison >développement back-end >Tutoriel Python >Comment définir efficacement des valeurs dans des cellules Pandas DataFrame spécifiques ?

Comment définir efficacement des valeurs dans des cellules Pandas DataFrame spécifiques ?

Patricia Arquette
Patricia Arquetteoriginal
2024-12-06 21:29:12833parcourir

How to Efficiently Set Values in Specific Pandas DataFrame Cells?

Définition de valeurs dans des cellules spécifiques d'un DataFrame Pandas par index

Dans l'analyse de données à l'aide de Pandas, il devient souvent nécessaire de modifier les valeurs de cellules individuelles dans un DataFrame. Ceci peut être réalisé en utilisant diverses méthodes, notamment df. xs, df['colonne'] et df.at.

1. df.xs (Obsolète)

La méthode df.xs() permet de sélectionner une ligne spécifique du DataFrame. Cependant, l'attribution d'une valeur à une colonne dans la ligne renvoyée ne modifie pas le DataFrame d'origine. Au lieu de cela, il crée un nouveau DataFrame contenant la ligne modifiée. Par exemple :

df.xs('C')['x'] = 10

2. df['column']

L'indexation de chaîne à l'aide de df['column'] renvoie une vue de la colonne spécifiée. L'attribution d'une valeur à la colonne sélectionnée modifie directement le DataFrame d'origine. Par exemple :

df['x']['C'] = 10

3. df.at (Recommandé)

La méthode recommandée pour définir des valeurs de cellule spécifiques dans un DataFrame utilise df.at. Cette méthode prend l'index de la ligne et de la colonne comme arguments et attribue directement la nouvelle valeur à la cellule spécifiée. Il modifie le DataFrame d'origine sans en créer un nouveau.

df.at['C', 'x'] = 10

Considérations sur les performances

Pour les grands DataFrames, les performances deviennent cruciales. Les benchmarks indiquent que df.set_value, qui est obsolète, est nettement plus rapide que df['column'] et df.at. Cependant, comme set_value est obsolète, df.at devrait être utilisé comme méthode recommandée à l'avenir.

Conclusion

La définition de valeurs dans des cellules spécifiques d'un Pandas DataFrame peut être réalisé en utilisant différentes méthodes, chacune avec ses propres avantages et caractéristiques de performance. Comprendre la différence entre créer un nouveau DataFrame et modifier celui existant est essentiel pour sélectionner la méthode appropriée. Pour de meilleures performances et maintenabilité, il est recommandé d'utiliser df.at car il modifie directement le DataFrame d'origine et constitue la méthode préférée pour définir les valeurs des cellules.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn