Maison >développement back-end >Tutoriel Python >Comment puis-je créer de nouvelles colonnes avec des valeurs conditionnelles dans des DataFrames à l'aide de NumPy ?
Création d'une nouvelle colonne avec des valeurs conditionnelles
Lors de l'analyse des données, il peut être nécessaire de créer de nouvelles colonnes dans lesquelles les valeurs sont sélectionnées en fonction de colonnes existantes. Cela vous permet de catégoriser ou de transformer les données pour une analyse ou une visualisation plus approfondie. Voici deux approches :
np.where pour deux choix :
Si vous devez choisir entre seulement deux valeurs en fonction d'une colonne existante, vous pouvez utiliser le np .où fonction. Par exemple, pour créer une colonne "color" dans un dataframe où "color='green'" si "Set=='Z'" et "color='red'" sinon, vous pouvez utiliser :
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
np.select pour plusieurs conditions :
Si vous avez plus de deux conditions à prendre en compte lors de la sélection de valeurs, vous pouvez utiliser la fonction np.select. Par exemple, pour créer une colonne « couleur » basée sur plusieurs conditions :
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
En utilisant np.where ou np.select, vous pouvez facilement créer de nouvelles colonnes avec des valeurs conditionnelles, offrant ainsi une flexibilité dans la manipulation des données et permettant des informations plus approfondies à partir de vos données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!