Maison  >  Article  >  développement back-end  >  Pourquoi l'indexation Pandas avec plusieurs conditions présente-t-elle un comportement inattendu ?

Pourquoi l'indexation Pandas avec plusieurs conditions présente-t-elle un comportement inattendu ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-10-25 09:47:02156parcourir

Why Does Pandas Indexing with Multiple Conditions Exhibit Unexpected Behavior?

Indexation à conditions multiples Pandas : comportement inattendu

Avec les pandas, l'application de filtres à un DataFrame est une opération courante. Cependant, lors de l'utilisation de plusieurs conditions, en particulier avec des opérateurs logiques tels que AND et OR, des résultats inattendus peuvent se produire.

Problème :

Lors du filtrage des lignes en fonction des valeurs de deux colonnes , l'opérateur AND semble se comporter comme OR, et vice versa. Par exemple, le code ci-dessous devrait :

  • Utilisez l'opérateur AND pour exclure les lignes où l'une des valeurs de colonne est -1.
  • Utilisez l'opérateur OR pour exclure les lignes où les deux valeurs de colonne sont -1.
<code class="python">df = pd.DataFrame({'a': range(5), 'b': range(5) })

df['a'][1] = -1
df['b'][1] = -1
df['a'][3] = -1
df['b'][4] = -1

df1 = df[(df.a != -1) & (df.b != -1)]
df2 = df[(df.a != -1) | (df.b != -1)]

print(pd.concat([df, df1, df2], axis=1,
                keys=['original df', 'using AND (&)', 'using OR (|)',]))</code>

Explication :

Le comportement inattendu provient de la façon dont les opérateurs logiques sont interprétés dans le contexte de l'indexation des pandas.

  • Opérateur AND :

    • df[(df.a != -1) & (df.b != -1)] signifie "conserver les lignes où df.a n'est pas -1 et df.b n'est pas -1".
    • Cela filtre les lignes où au moins une valeur est -1.
  • Opérateur OU :

    • df[(df.a != -1) | (df.b != -1)] signifie "conserver les lignes où df.a ou df.b n'est pas -1".
    • Cela filtre les lignes où les deux valeurs sont -1.

Par conséquent, l'opérateur AND se comporte comme OR car il exclut les lignes en fonction de l'absence de -1 dans l'une ou l'autre des colonnes. À l'inverse, l'opérateur OR se comporte comme AND car il inclut des lignes uniquement lorsque les deux colonnes ne contiennent pas -1.

Remarque supplémentaire :

  • Il est recommandé d'utiliser .loc et .iloc au lieu de l'indexation chaînée (par exemple, df'a' = -1) pour des pratiques de code plus propres et plus sûres.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn