DataFrame 병합: 추출된 데이터세트 결합
데이터 조작의 맥락에서 여러 데이터 프레임을 결합하는 것은 일반적인 요구 사항입니다. 주어진 시나리오에서 초기 DataFrame D가 있고 특정 조건에 따라 두 개의 하위 집합 A와 B를 추출한다고 가정합니다.
A = D[D.label == k] B = D[D.label != k]
목표는 A와 B를 다시 단일 DataFrame으로 병합하는 것입니다. . 데이터의 순서는 중요하지 않지만 D에서 파생된 A와 B의 원래 인덱스를 유지하는 것이 중요합니다.
해결책: Append 메서드 사용
데이터 프레임을 결합하는 한 가지 접근 방식은 추가 방법을 사용하는 것입니다. 이 방법을 사용하면 하나 이상의 데이터 프레임을 수직으로 연결하여 효과적으로 서로 쌓을 수 있습니다. 우리의 경우 아래 코드를 사용할 수 있습니다.
df_merged = df1.append(df2, ignore_index=True)
이렇게 하면 A와 B의 결합된 데이터를 포함하는 df_merged라는 새 DataFrame이 생성됩니다.ignore_index=True 인수는 결과 DataFrame이 원본과 독립적인 고유한 인덱스 세트.
원본 인덱스 유지
A와 B의 원래 인덱스를 유지하려면ignore_index=를 설정할 수 있습니다. 추가 방법의 경우 False:
df_merged = df1.append(df2, ignore_index=False)
이렇게 하면 병합된 결과 내에서 각 데이터 프레임의 인덱스 값이 보존됩니다. 그러나 최종 DataFrame에서는 인덱스가 중복된 값이 될 수 있다는 점에 유의해야 합니다.
위 내용은 Python에서 DataFrame을 병합하고 원본 인덱스를 보존하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!