Maison >développement back-end >Tutoriel Python >Comment puis-je créer une nouvelle colonne dans Pandas basée sur les valeurs d'une colonne existante ?
Sélectionner des valeurs particulières dans une colonne existante pour remplir une nouvelle colonne est une tâche courante de manipulation de données. Explorons deux approches pour y parvenir en Python à l'aide de Pandas.
Lorsqu'il n'y a que deux options parmi lesquelles choisir , la fonction np.where est un choix pratique. Dans l'exemple fourni, nous souhaitons créer une colonne de couleur avec « vert » pour les valeurs de la colonne Définir égales à « Z » et « rouge » sinon.
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
Pour les scénarios avec plus de deux choix, np.select offre une plus grande flexibilité. Introduisons plus de conditions pour la colonne de couleur :
Le code de ce scénario est le suivant :
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
Cette approche permet une personnalisation facile des conditions et des valeurs à sélectionner, ce qui la rend adaptée à des cas plus complexes. scénarios.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!