Maison >développement back-end >Tutoriel Python >Comment sélectionner des lignes spécifiques dans les DataFrames Pandas en fonction des valeurs de colonne ?
Lorsque vous travaillez avec des Pandas DataFrames, il est souvent nécessaire de filtrer les lignes en fonction de valeurs spécifiques dans une colonne particulière. Cela imite les requêtes SQL où les lignes sont récupérées à l'aide de filtres tels que WHERE column_name = some_value.
Pour sélectionner les lignes où une valeur de colonne correspond à une valeur scalaire, some_value, utilisez l'opérateur d'égalité == :
df.loc[df['column_name'] == some_value]
Pour sélectionner des lignes où une valeur de colonne se trouve dans un tableau, some_values, utilisez la méthode isin :
df.loc[df['column_name'].isin(some_values)]
Plusieurs conditions peuvent être combinées à l'aide de l'opérateur logique & :
df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]
Remarque : Utilisez des parenthèses pour garantir que la priorité des opérateurs est correct.
Pour sélectionner les lignes où la valeur d'une colonne n'est pas égale à some_value, utilisez l'opérateur d'inégalité !=:
df.loc[df['column_name'] != some_value]
Pour isin, annulez le résultat en utilisant ~ :
df = df.loc[~df['column_name'].isin(some_values)]
Considérez ce qui suit DataFrame :
import pandas as pd df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.arange(8), 'D': np.arange(8) * 2}) print(df)
Sélectionnez les lignes où A est foo :
print(df.loc[df['A'] == 'foo'])
Sélectionnez les lignes où B vaut un ou trois :
print(df.loc[df['B'].isin(['one', 'three'])])
Créez un index et sélectionnez des lignes en utilisant it :
df = df.set_index(['B']) print(df.loc['one'])
Sélectionnez des lignes avec plusieurs valeurs indexées :
print(df.loc[df.index.isin(['one', 'two'])])
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!