Maison >développement back-end >Tutoriel Python >Comment diviser le texte d'une colonne en plusieurs lignes dans un DataFrame pandas ?

Comment diviser le texte d'une colonne en plusieurs lignes dans un DataFrame pandas ?

Barbara Streisand
Barbara Streisandoriginal
2024-11-10 20:55:02359parcourir

How do you split text in a column into multiple rows in a pandas DataFrame?

Diviser le texte d'une colonne en plusieurs lignes

Dans un gros fichier CSV, les utilisateurs rencontrent souvent le besoin de diviser les données textuelles d'une colonne en lignes distinctes pour une analyse plus facile. et la manipulation des données. Lorsque vous travaillez avec Pandas ou Python, plusieurs méthodes peuvent être utilisées pour atteindre cet objectif.

Une approche courante consiste à tirer parti de la méthode split sur la colonne souhaitée pour subdiviser le texte en fonction d'un délimiteur spécifié. Par exemple, pour diviser une colonne nommée « Seatblocks » par des espaces et des deux-points, la syntaxe suivante peut être utilisée :

s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
s.index = s.index.droplevel(-1)  # align with df's index
s.name = 'Seatblocks'  # assign a name for joining

Après avoir divisé la colonne, elle peut être rejointe avec le DataFrame d'origine à l'aide de la méthode de jointure :

del df['Seatblocks']
df.join(s)

Alternativement, pour créer des colonnes distinctes pour chaque chaîne séparée par deux points, le code suivant peut être appliqué :

df.join(s.apply(lambda x: Series(x.split(':'))))

En employant ces méthodes, les utilisateurs peuvent diviser efficacement les données textuelles en plusieurs lignes, permettant une analyse plus granulaire et une manipulation des données dans leurs efforts de programmation.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn