Maison  >  Article  >  développement back-end  >  Comment remplir efficacement les valeurs manquantes dans une colonne en utilisant les valeurs correspondantes d'une autre colonne dans pandas ?

Comment remplir efficacement les valeurs manquantes dans une colonne en utilisant les valeurs correspondantes d'une autre colonne dans pandas ?

DDD
DDDoriginal
2024-11-13 05:29:02114parcourir

How to efficiently fill missing values in one column using corresponding values from another column in pandas?

Utiliser efficacement fillna() pour remplir les valeurs manquantes avec les valeurs correspondantes d'une autre colonne

Lorsque vous travaillez avec des données tabulaires, les valeurs manquantes sont un phénomène courant qui peut gêner l'analyse. La méthode pandas fillna() fournit une solution simple et efficace pour remplacer ces valeurs nulles par les valeurs souhaitées. Cependant, attribuer directement des valeurs spécifiques aux cellules manquantes via fillna() peut s'avérer inefficace et prendre beaucoup de temps, en particulier pour les grands ensembles de données.

Pour surmonter cette limitation, pandas propose une fonctionnalité puissante qui vous permet de remplir les valeurs manquantes avec éléments correspondants d’une autre colonne. Cette approche élimine le besoin d'itération manuelle sur chaque ligne, améliorant considérablement les performances et la maintenabilité.

Considérez l'exemple suivant dans lequel vous souhaitez remplir les valeurs manquantes dans la colonne « Cat1 » à l'aide des valeurs de la colonne « Cat2 ».

Avant :

Day Cat1 Cat2
1 cat mouse
2 dog elephant
3 cat giraf
4 NaN ant

Après :

Day Cat1 Cat2
1 cat mouse
2 dog elephant
3 cat giraf
4 ant ant

Avec la méthode fillna(), vous pouvez accomplir cette tâche en toute simplicité :

df['Cat1'].fillna(df['Cat2'])

Ce code remplacera sans effort les valeurs manquantes dans « Cat1 » par les valeurs correspondantes de « Cat2 », préservant ainsi la structure des données et empêchant l'introduction de valeurs incorrectes ou incohérentes. Le DataFrame résultant contiendra des données complètes et cohérentes, prêtes pour une analyse ou un traitement ultérieur.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn