Maison >développement back-end >Tutoriel Python >Comment calculer le produit cartésien des DataFrames dans Pandas ?

Comment calculer le produit cartésien des DataFrames dans Pandas ?

DDD
DDDoriginal
2024-12-29 06:32:14470parcourir

How to Calculate the Cartesian Product of DataFrames in Pandas?

Comment obtenir un produit cartésien dans Pandas

Dans Pandas, un DataFrame est une structure de données tabulaire. Effectuer des opérations sur plusieurs DataFrames est souvent nécessaire pour l’analyse des données. L'une de ces opérations est le produit cartésien, qui combine toutes les lignes de deux DataFrames dans un nouveau DataFrame.

Fusion pour le produit cartésien (Pandas >= 1.2)

Le La fonction de fusion dans Pandas fournit une méthode efficace pour obtenir un produit cartésien. Pour les versions 1.2 et supérieures, utilisez ce qui suit :

df1 = DataFrame({'col1': [1, 2], 'col2': [3, 4]})
df2 = DataFrame({'col3': [5, 6]})

df1.merge(df2, how='cross')

Cela renvoie un nouveau DataFrame avec toutes les combinaisons de lignes de df1 et df2.

Fusion pour le produit cartésien (Pandas < ; 1.2)

Pour les versions antérieures de Pandas, la fusion peut toujours être utilisée s'il y a est une clé répétée pour chaque ligne. Cette clé permet d'aligner les lignes pour le produit cartésien :

df1 = DataFrame({'key': [1, 1], 'col1': [1, 2], 'col2': [3, 4]})
df2 = DataFrame({'key': [1, 1], 'col3': [5, 6]})

merge(df1, df2, on='key')[['col1', 'col2', 'col3']]

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:lowCalAlt_update 6Article suivant:lowCalAlt_update 6