>  기사  >  백엔드 개발  >  Pandas DataFrame에서 쉼표로 구분된 값을 여러 행으로 구분하는 방법은 무엇입니까?

Pandas DataFrame에서 쉼표로 구분된 값을 여러 행으로 구분하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-10-27 19:32:02493검색

How to Separate Comma-Separated Values into Multiple Rows in a Pandas DataFrame?

Pandas DataFrame에서 셀을 여러 행으로 분할

이 시나리오에는 주문 데이터가 포함된 DataFrame이 있으며, 각 주문에는 여러 패키지가 쉼표로 구분되어 저장되어 있습니다. package 및 package_code 열의 문자열. 목표는 이러한 패키지를 분할하고 해당 주문 세부 정보를 포함하는 각 패키지에 대해 새 행을 생성하는 것입니다.

분할 가능한 모든 열에 동일한 수의 쉼표로 구분된 항목이 있다고 가정하면 다음 단계를 활용하여 달성할 수 있습니다. 원하는 출력:

<code class="python">import pandas as pd

# Create the sample DataFrame
df = pd.DataFrame({"order_id": [1, 3, 7], "order_date": ["20/5/2018", "22/5/2018", "23/5/2018"], "package": ["p1,p2,p3", "p4", "p5,p6"], "package_code": ["#111,#222,#333", "#444", "#555,#666"]})

# Use pandas functions to split and explode the columns
result_df = (df.set_index(['order_id', 'order_date'])
              .apply(lambda x: x.str.split(',').explode())
              .reset_index())

# Display the output DataFrame
print(result_df)</code>

이 코드는 먼저 인덱스로 건드리지 않을 열을 설정합니다. 그런 다음 각 열을 반복하고 쉼표로 값을 분할한 다음 해당 값을 자체 행으로 분해합니다. 마지막으로 원하는 형식을 얻기 위해 인덱스가 재설정됩니다.

출력 DataFrame에는 주문 세부 정보를 포함하여 각 패키지에 대해 별도의 행이 있습니다.

위 내용은 Pandas DataFrame에서 쉼표로 구분된 값을 여러 행으로 구분하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.