Maison  >  Article  >  développement back-end  >  Comment fusionner des DataFrames par index en Python ?

Comment fusionner des DataFrames par index en Python ?

Barbara Streisand
Barbara Streisandoriginal
2024-11-01 04:20:28989parcourir

How to Merge DataFrames by Index in Python?

Fusionner des dataframes par index

Lorsque vous travaillez avec des dataframes, il est souvent nécessaire de les combiner en fonction d'index correspondants. Bien que les opérations de fusion reposent généralement sur des correspondances de colonnes, il est possible de fusionner des trames de données en fonction de leurs indices.

Jointure interne sur les indices

Pour fusionner deux trames de données par index à l'aide d'un jointure interne, vous pouvez utiliser la fonction de fusion avec les arguments left_index et right_index définis sur True :

pd.merge(left_dataframe, right_dataframe, left_index=True, right_index=True)

Cette opération créera une nouvelle trame de données qui contient uniquement les lignes où les indices des deux trames de données correspondent.

Exemple :

Considérez les dataframes suivants :

df1
  id  begin  conditional  confidence  discoveryTechnique
0  278    56       false        0.0                  1   
1  421    18       false        0.0                  1 

df2
   concept
0     A 
1     B

La fusion de ces dataframes par index entraînerait :

  id  begin  conditional  confidence  discoveryTechnique  concept 
0  278    56       false        0.0                  1       A 
1  421    18       false        0.0                  1       B

Jointure gauche sur les indices

Pour une jointure gauche par index, vous pouvez utiliser la méthode de jointure sur le dataframe de gauche :

left_dataframe.join(right_dataframe, on='index')

Jointure externe sur Indices

Pour effectuer une jointure externe sur les indices, vous pouvez utiliser la fonction concat avec l'argument d'axe défini sur 1 :

pd.concat([left_dataframe, right_dataframe], axis=1)

Considérations

Bien qu'il soit généralement possible de fusionner des trames de données par index, il est important de noter que cela peut entraîner des lignes en double si les index ne sont pas uniques dans les deux trames de données. Dans de tels cas, il peut être nécessaire de s'assurer d'abord que les indices sont uniques avant de fusionner.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn