>백엔드 개발 >파이썬 튜토리얼 >Pandas에서 DataFrame의 데카르트 곱을 효율적으로 계산하는 방법은 무엇입니까?

Pandas에서 DataFrame의 데카르트 곱을 효율적으로 계산하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-07 17:32:13501검색

How to Efficiently Calculate the Cartesian Product of DataFrames in Pandas?

Pandas의 데카르트 곱

Pandas에서 두 개 이상의 데이터 프레임으로 작업할 때 데카르트 곱을 가져와야 할 수 있으며, 이로 인해 다음과 같은 새로운 데이터 프레임이 생성됩니다. 입력 데이터프레임의 모든 행 조합.

Pandas >= 1.2

최신 버전의 Pandas에서는 병합 기능을 활용하여 How='cross' 인수를 사용하여 이 작업을 수행할 수 있습니다. 이 접근 방식은 간결하면서도 효율적입니다.

import pandas as pd

df1 = pd.DataFrame({'col1':[1,2],'col2':[3,4]})
df2 = pd.DataFrame({'col3':[5,6]})

df_cartesian = df1.merge(df2, how='cross')

Pandas < 1.2

Pandas 이전 버전의 경우 약간 다른 기술이 필요합니다. 여기에는 두 데이터프레임의 각 행에 대해 반복되는 키 열을 만드는 작업이 포함됩니다. 이 키 열이 추가되면 병합을 사용하여 데카르트 곱을 수행할 수 있습니다.

import pandas as pd
from pandas import merge

df1 = pd.DataFrame({'key':[1,1], 'col1':[1,2],'col2':[3,4]})
df2 = pd.DataFrame({'key':[1,1], 'col3':[5,6]})

merge(df1, df2,on='key')[['col1', 'col2', 'col3']]

이 접근 방식은 더 복잡하지만 이전 버전의 Pandas에서 효과적으로 작동합니다.

위 내용은 Pandas에서 DataFrame의 데카르트 곱을 효율적으로 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.