Maison  >  Article  >  développement back-end  >  Comment diviser une colonne de tuples en plusieurs colonnes dans un DataFrame Pandas ?

Comment diviser une colonne de tuples en plusieurs colonnes dans un DataFrame Pandas ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-10-25 04:52:02690parcourir

How to Split a Column of Tuples into Multiple Columns in a Pandas DataFrame?

Diviser une colonne de tuples dans un DataFrame Pandas

Dans les dataframes Pandas, diviser une colonne contenant des tuples en plusieurs colonnes est une opération courante. Pour y parvenir, on peut adopter les méthodes suivantes :

Utilisation de pd.DataFrame(col.tolist())

Cette méthode convertit la colonne du tuple en une liste de tuples, puis crée une nouvelle trame de données à partir de ceux-ci. L'index de la nouvelle trame de données correspond à celui de l'original.

<code class="python">import pandas as pd

# Create a dataframe with a column containing tuples
df = pd.DataFrame({'a': [1, 2], 'b': [(1, 2), (3, 4)]})

# Split the 'b' column into 'b1' and 'b2'
df[['b1', 'b2']] = pd.DataFrame(df['b'].tolist(), index=df.index)

# Print the resulting dataframe
print(df)</code>

Sortie :

   a  b  b1  b2
0  1  (1, 2)   1   2
1  2  (3, 4)   3   4

Remarque : Utiliser df['b'].apply(pd.Series) au lieu de pd.DataFrame(df['b'].tolist(), index=df.index) fonctionne également. Cependant, il est plus lent et nécessite plus de mémoire.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn