Maison >développement back-end >Tutoriel Python >Comment les DataFrames Pandas fusionnent-ils en utilisant différents types de jointure ?

Comment les DataFrames Pandas fusionnent-ils en utilisant différents types de jointure ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-12-27 13:17:11341parcourir

How Do Pandas DataFrames Merge Using Different Join Types?

Pandas Merging 101

Comprendre la fusion

La fusion combine deux ou plusieurs DataFrames basés sur des clés partagées pour créer un nouveau DataFrame . Pandas propose différents types de fusions, notamment les jointures INNER, LEFT, RIGHT et FULL OUTER.

Types de jointure de base

a. INNER JOIN

  • Combine les lignes qui partagent des clés communes dans les deux DataFrames.
  • Exemple :

    left = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': np.random.randn(4)})
    right = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': np.random.randn(4)})
    left.merge(right, on='key')

b. LEFT OUTER JOIN

  • Conserve toutes les lignes du DataFrame de gauche, en ajoutant des valeurs NaN pour les clés manquantes dans le DataFrame de droite.
  • Exemple :

    left.merge(right, on='key', how='left')

c. RIGHT OUTER JOIN

  • Conserve toutes les lignes du DataFrame droit, en ajoutant des valeurs NaN pour les clés manquantes dans le DataFrame gauche.
  • Exemple :

    left.merge(right, on='key', how='right')

d. FULL OUTER JOIN

  • Combine toutes les lignes des deux DataFrames, en ajoutant des valeurs NaN pour les clés manquantes.
  • Exemple :

    left.merge(right, on='key', how='outer')

Exclusion de données avec exclusion gauche/droite Jointures

Si vous devez exclure des lignes spécifiques, vous pouvez effectuer une JOINTURE avec exclusion de gauche ou avec exclusion de droite en effectuant d'abord une JOINTURE EXTERNE GAUCHE/DROITE et en filtrant pour exclure les lignes de l'autre DataFrame.

e. Left-Excluding JOIN

  • Exclut les lignes du DataFrame droit présentes dans le DataFrame gauche.
  • Exemple :

    (left.merge(right, on='key', how='left', indicator=True)
     .query('_merge == "left_only"')
     .drop('_merge', 1))

f. Right-Excluding JOIN

  • Exclut les lignes du DataFrame de gauche présentes dans le DataFrame de droite.
  • Exemple :

    (left.merge(right, on='key', how='right', indicator=True)
     .query('_merge == "right_only"')
     .drop('_merge', 1))

g. ANTI JOIN

  • Combine les lignes qui ne sont pas présentes dans les deux DataFrames.
  • Exemple :

    (left.merge(right, on='key', how='outer', indicator=True)
     .query('_merge != "both"')
     .drop('_merge', 1))

Gestion des colonnes clés en double

À Pour éviter les colonnes clés en double dans la sortie, vous pouvez définir les index appropriés comme clés avant de fusionner :

left3 = left2.set_index('keyLeft')
left3.merge(right2, left_index=True, right_on='keyRight')

Fusion sur plusieurs colonnes

Pour joindre plusieurs colonnes, spécifiez une liste pour on (ou left_on et right_on, selon le cas).

left.merge(right, on=['key1', 'key2'] ...)

Fusion supplémentaire Fonctions

  • pd.merge_ordered : Pour les JOINs ordonnées.
  • pd.merge_asof : Pour les jointures approximatives.

Se référer à la documentation sur la fusion , rejoignez et concaténez pour des exemples et des cas plus spécifiques.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn