Maison >développement back-end >Tutoriel Python >Comment puis-je concaténer efficacement des colonnes de texte dans un DataFrame Pandas ?
Dans le domaine de la manipulation de données, le besoin de combiner plusieurs colonnes de texte en une seule colonne cohérente se pose souvent. Explorons un scénario courant impliquant un DataFrame avec des colonnes « Année » et « Trimestre », où l'objectif est de créer une nouvelle colonne « période » représentant les valeurs combinées.
Pour y parvenir, nous utilisons les stratégies suivantes :
Concaténation directe (colonnes de chaîne)
Si 'Année' et Les colonnes 'quart' sont de type chaîne, nous pouvons les concaténer directement en utilisant :
df["period"] = df["Year"] + df["quarter"]
Conversion de type (colonnes non chaîne)
Si l'une des colonnes n'est pas typé en chaîne, il faut d'abord les convertir en chaînes :
df["period"] = df["Year"].astype(str) + df["quarter"]
Attention : Gérez les NaN avec soin lors de la concaténation.
Agrégation pour plusieurs colonnes de chaînes
Lorsque nous traitons avec plusieurs colonnes de chaînes, nous pouvons utiliser la fonction « agg » :
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
Ici, '-' sert de séparateur entre les valeurs des colonnes.
En employant ces techniques, vous pouvez facilement combiner des colonnes de texte dans votre Pandas DataFrame, ouvrant la voie à un traitement et une analyse transparents des données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!