Maison >développement back-end >Tutoriel Python >Comment puis-je combiner des colonnes de texte dans un DataFrame Pandas pour créer une nouvelle colonne ?
Dans les pandas, la manipulation des données implique souvent de combiner des colonnes pour obtenir des informations significatives. Un tel scénario se produit lorsque nous devons fusionner des colonnes de texte pour créer une nouvelle colonne de texte.
Considérez le cadre de données suivant avec deux colonnes de texte, « Année » et « trimestre » :
Year quarter 2000 q2 2001 q3
Notre objectif est de créer une nouvelle colonne appelée « période » qui combine les colonnes « Année » et « trimestre » pour obtenir des valeurs comme « 2000q2 » et "2001q3."
Pour y parvenir, nous pouvons directement concaténer les colonnes "Année" et "trimestre" si les deux sont des chaînes :
df["period"] = df["Year"].astype(str) + df["quarter"]
Cependant, si une ou les deux colonnes ne le sont pas chaînes, nous devons les convertir en chaînes avant de concaténer. Par exemple :
df["period"] = df["Year"].astype(str) + df["quarter"]
Il est essentiel de faire attention aux valeurs NaN lors de l'exécution de cette opération, car elles peuvent conduire à des résultats inattendus.
Alternativement, si plusieurs colonnes de chaînes doivent être jointes, la méthode agg peut s'avérer utile :
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
Dans ce cas, "-" est utilisé comme séparateur, mais vous pouvez le personnaliser comme nécessaire.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!