>  기사  >  백엔드 개발  >  공유 열을 기반으로 Pandas DataFrame을 결합하는 방법: 'join()' 및 'merge()' 가이드

공유 열을 기반으로 Pandas DataFrame을 결합하는 방법: 'join()' 및 'merge()' 가이드

Barbara Streisand
Barbara Streisand원래의
2024-10-24 22:10:02162검색

How to Combine Pandas DataFrames Based on a Shared Column: A Guide to `join()` and `merge()`

공유 열에서 Pandas 데이터 프레임 결합: 종합 가이드

소개

여러 데이터 프레임의 데이터를 결합하는 것은 데이터 분석에서 일반적인 작업입니다. . Pandas는 이를 달성하기 위해 Join() 및 merge() 함수를 포함하여 여러 가지 방법을 제공합니다. 이 기사에서는 이러한 함수를 사용하여 공통 열을 공유하는 두 개의 데이터 프레임을 결합하는 방법을 보여줍니다.

join() 함수 사용

join() 함수는 기본적으로 내부 조인을 수행합니다. 조인 열에 일치하는 값이 있는 행만 유지됩니다. 제공된 예에서는 오류 메시지에 표시된 대로 Restaurant_ids_dataframe과 Restaurant_review_frame에 겹치는 열 이름(별표 및 유형)이 있으므로 Join() 함수를 사용할 수 없습니다.

Exception: columns overlap: Index([business_id, stars, type], dtype=object)

merge() 함수 사용

merge() 함수는 데이터 프레임 결합에 더 큰 유연성을 제공합니다. 두 데이터 프레임의 모든 행을 유지하는 외부 조인을 수행하려면 How='outer' 매개변수를 사용하세요.

<code class="python">import pandas as pd
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')</code>

기본적으로 merge()는 접미사('_x', '_y')를 사용합니다. ) 이름이 중복된 열을 구별합니다. 접미사를 사용자 정의하려면 아래와 같이 suffixes 매개 변수에 값을 전달하세요.

<code class="python">pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))</code>

결론

join() 및 merge() 함수 모두 데이터 프레임을 결합하는 데 사용할 수 있습니다. 공통 열에. 원하는 조인 동작을 달성하려면 이러한 기능 간의 차이점을 이해하는 것이 중요합니다. merge() 함수는 외부 조인을 수행하고 열 접미사를 사용자 정의하는 기능을 포함하여 더 많은 유연성을 제공합니다. 이러한 기술을 익히면 데이터 프레임을 효과적으로 결합하여 데이터 세트에서 의미 있는 통찰력을 추출할 수 있습니다.

위 내용은 공유 열을 기반으로 Pandas DataFrame을 결합하는 방법: 'join()' 및 'merge()' 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.