>백엔드 개발 >파이썬 튜토리얼 >두 개의 변수를 사용하여 Pandas에서 길고 넓은 데이터를 재구성하는 방법은 무엇입니까?

두 개의 변수를 사용하여 Pandas에서 길고 넓은 데이터를 재구성하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-29 18:05:02940검색

How to Reshape Long to Wide Data in Pandas Using Two Variables?

두 개의 변수를 사용하여 긴 형식을 넓은 형식으로 재구성하는 팬더

긴 형식과 넓은 형식 간의 데이터를 조작하는 것은 데이터 분석에서 일반적인 작업입니다. Python의 Pandas 라이브러리에서는 이러한 목적으로 일반적으로 용해 및 스택/스택 해제 작업이 사용됩니다. 그러나 보다 직접적인 접근 방식이 필요한 특정 시나리오가 발생할 수 있습니다.

이러한 시나리오 중 하나는 두 개의 변수(예: 매출과 같은 숫자 변수 및 제품과 같은 범주형 변수)를 포함하는 데이터를 넓은 형식으로 재구성하는 경우입니다. . 용해/적재/적재 해제 방법만으로는 원하는 출력을 제공하지 못할 수 있습니다.

이 예에는 판매원, 높이, 제품 및 가격 열이 포함된 "긴" 데이터가 있습니다. 우리의 목표는 해당 가격을 포함하여 각 고유 제품에 대한 열이 포함된 "와이드" 형식으로 이 데이터를 재구성하는 것입니다.

Salesman  Height   product      price
  Knut      6        bat          5
  Knut      6        ball         1
  Knut      6        wand         3
  Steve     5        pen          2

이를 달성하기 위해 Pandas의 피벗 기능을 활용할 수 있습니다. 피벗 테이블을 만드는 방법. 인덱스 열(Salesman), 피벗 열(obs) 및 값 열(price)을 지정합니다.

다음은 데이터 형태를 변경하는 Python 코드입니다.

<code class="python">wide_df = df.pivot(index='Salesman', columns='product', values='price')</code>

이렇게 하면 원하는 "와이드" 형식:

Salesman  Height    product_1  price_1  product_2 price_2 product_3 price_3  
  Knut      6        bat          5       ball      1        wand      3
  Steve     5        pen          2        NA       NA        NA       NA

위 내용은 두 개의 변수를 사용하여 Pandas에서 길고 넓은 데이터를 재구성하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.