Maison >développement back-end >Tutoriel Python >Comment puis-je créer des colonnes conditionnelles dans un DataFrame en fonction des valeurs de colonne existantes ?

Comment puis-je créer des colonnes conditionnelles dans un DataFrame en fonction des valeurs de colonne existantes ?

Barbara Streisand
Barbara Streisandoriginal
2024-12-21 07:27:09672parcourir

How Can I Create Conditional Columns in a DataFrame Based on Existing Column Values?

Création de colonnes conditionnelles basées sur les valeurs de colonnes existantes

Dans l'analyse des données, il est souvent nécessaire de créer de nouvelles colonnes dont les valeurs sont déterminées en fonction de conditions dérivé de colonnes existantes. Considérez le scénario dans lequel vous disposez d'un DataFrame avec deux colonnes : "Type" et "Set" et vous souhaitez ajouter une nouvelle colonne appelée "color" qui suit des règles spécifiques.

Ajout d'une colonne de couleur Basé sur les valeurs définies

Pour créer une colonne "couleur" où les valeurs sont "vertes" si "Set" est "Z" et "rouge" sinon, vous pouvez utiliser ce qui suit approche :

import numpy as np

df['color'] = np.where(df['Set'] == 'Z', 'green', 'red')

Ce code utilise la fonction np.where, qui sélectionne les valeurs en fonction d'une condition. Si la valeur de la colonne « Définir » est « Z », la valeur « couleur » devient « vert » ; sinon, il devient « rouge ».

Utilisation de np.select pour des conditions plus complexes

Pour des scénarios plus complexes où vous avez plusieurs conditions, vous pouvez utiliser np.select . Par exemple, supposons que vous souhaitiez attribuer des couleurs selon les règles suivantes :

  • "jaune" si "Set" est "Z" et "Type" est "A"
  • "bleu" si "Set" est "Z" et "Type" est "B"
  • "violet" si "Type" est "B"
  • "noir" sinon
conditions = [
    (df['Set'] == 'Z') & (df['Type'] == 'A'),
    (df['Set'] == 'Z') & (df['Type'] == 'B'),
    (df['Type'] == 'B')]
choices = ['yellow', 'blue', 'purple']
df['color'] = np.select(conditions, choices, default='black')

La fonction np.select prend une liste de conditions et une liste de choix correspondante. Si la condition est remplie, le choix associé est sélectionné ; sinon, la valeur par défaut est utilisée.

Ces méthodes offrent des options polyvalentes pour créer des colonnes conditionnelles basées sur les valeurs de colonnes existantes, vous permettant ainsi de manipuler et d'analyser efficacement vos données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn