Maison >développement back-end >Tutoriel Python >Comment remplir efficacement les valeurs manquantes dans une colonne en utilisant les valeurs correspondantes d'une autre colonne dans pandas ?
Lorsque vous travaillez avec des données tabulaires, les valeurs manquantes sont un phénomène courant qui peut gêner l'analyse. La méthode pandas fillna() fournit une solution simple et efficace pour remplacer ces valeurs nulles par les valeurs souhaitées. Cependant, attribuer directement des valeurs spécifiques aux cellules manquantes via fillna() peut s'avérer inefficace et prendre beaucoup de temps, en particulier pour les grands ensembles de données.
Pour surmonter cette limitation, pandas propose une fonctionnalité puissante qui vous permet de remplir les valeurs manquantes avec éléments correspondants d’une autre colonne. Cette approche élimine le besoin d'itération manuelle sur chaque ligne, améliorant considérablement les performances et la maintenabilité.
Considérez l'exemple suivant dans lequel vous souhaitez remplir les valeurs manquantes dans la colonne « Cat1 » à l'aide des valeurs de la colonne « Cat2 ».
Day | Cat1 | Cat2 |
---|---|---|
1 | cat | mouse |
2 | dog | elephant |
3 | cat | giraf |
4 | NaN | ant |
Day | Cat1 | Cat2 |
---|---|---|
1 | cat | mouse |
2 | dog | elephant |
3 | cat | giraf |
4 | ant | ant |
Avec la méthode fillna(), vous pouvez accomplir cette tâche en toute simplicité :
df['Cat1'].fillna(df['Cat2'])
Ce code remplacera sans effort les valeurs manquantes dans « Cat1 » par les valeurs correspondantes de « Cat2 », préservant ainsi la structure des données et empêchant l'introduction de valeurs incorrectes ou incohérentes. Le DataFrame résultant contiendra des données complètes et cohérentes, prêtes pour une analyse ou un traitement ultérieur.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!