Maison  >  Article  >  développement back-end  >  Voici quelques options de titre qui correspondent au format de questions et réponses : * **Comment fusionner des DataFrames Pandas lorsqu'ils ont des colonnes qui se chevauchent ?** * **Colonnes qui se chevauchent dans les fusions Pandas : comment gérer

Voici quelques options de titre qui correspondent au format de questions et réponses : * **Comment fusionner des DataFrames Pandas lorsqu'ils ont des colonnes qui se chevauchent ?** * **Colonnes qui se chevauchent dans les fusions Pandas : comment gérer

Barbara Streisand
Barbara Streisandoriginal
2024-10-25 06:08:02724parcourir

Here are a few title options that fit the question-and-answer format:

* **How to Merge Pandas DataFrames When They Have Overlapping Columns?**
* **Overlapping Columns in Pandas Merges: How to Handle Them?**
* **What Happens When You Join DataFrames with

Combinaison de DataFrames à l'aide de Join : gestion des colonnes qui se chevauchent

Dans pandas, vous pouvez fusionner deux dataframes en les joignant sur une colonne commune. Cependant, vous avez rencontré une erreur lors de la tentative de cette opération en raison de colonnes qui se chevauchent.

L'erreur se produit car restaurant_ids_dataframe et restaurant_review_frame ont tous deux une colonne nommée « étoiles ». Lors d'une jointure gauche à l'aide de restaurant_review_frame.join(), les pandas créeront deux colonnes distinctes pour ces données qui se chevauchent : 'stars_x' et 'stars_y'.

Pour résoudre ce problème, vous pouvez utiliser la fonction de fusion à la place :

<code class="python">import pandas as pd
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')</code>

La fonction de fusion permet de spécifier la méthode de fusion (dans ce cas, une jointure externe en utilisant how='outer'), ainsi que les colonnes sur lesquelles joindre (on='business_id') .

Vous pouvez également modifier les suffixes des colonnes fusionnées à l'aide du paramètre suffixes :

<code class="python">pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))</code>

Cela créera deux colonnes nommées 'stars_restaurant_id' et 'stars_restaurant_review'.

En gérant correctement les colonnes qui se chevauchent, vous pouvez fusionner avec succès deux dataframes pandas et créer un dataframe combiné contenant toutes les informations pertinentes.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn