>백엔드 개발 >파이썬 튜토리얼 >심층적인 변경 분석을 위해 DataFrame을 나란히 효율적으로 비교하는 방법은 무엇입니까?

심층적인 변경 분석을 위해 DataFrame을 나란히 효율적으로 비교하는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-10-22 20:51:43677검색

How to Efficiently Compare DataFrames Side-by-Side for In-depth Change Analysis?

포괄적인 변경 분석을 위해 데이터 프레임을 나란히 비교

두 데이터 프레임 간의 불일치를 강조하기 위해 필요 없는 효율적인 방법이 있습니다. 힘든 행별 및 열별 비교를 위해. 특정 Python Pandas 기능을 활용하면 다양한 데이터 유형(예: int, float, boolean, string)에서 변경 사항을 정확히 찾아내고 이를 직관적인 HTML 테이블 형식으로 표시할 수 있습니다.

시작하려면 변경 사항이 있는지 확인하세요. 부울 함수(df1 != df2).any(1)를 사용하여 행이 변경되었습니다. 다음으로, 변경된 특정 항목을 식별하려면 ne_stacked = (df1 != df2).stack()을 사용하고 Change = ne_stacked[ne_stacked]를 활용하여 변경되지 않은 값을 필터링합니다.

실제 변경 내용을 얻으려면 값에 변경된 데이터의 위치를 ​​식별하는 Difference_locations = np.where(df1 != df2)를 통합합니다. Change_from = df1.values[difference_locations]를 사용하여 이러한 위치의 원래 데이터 프레임(df1)에서 값을 추출합니다. 마찬가지로, selected_to = df2.values[difference_locations]를 사용하여 두 번째 데이터프레임(df2)에서 해당 값을 추출합니다.

차이점을 종합적으로 표현하려면 변경된_from과 변경된_to를 열로 결합하고 인덱스를 설정하여 DataFrame을 구성합니다. 변경된 변수와 일치합니다. 이 DataFrame은 변경 사항을 명확하게 나란히 표시하여 각 데이터 포인트의 원래 값과 업데이트된 값을 모두 강조 표시합니다.

위 내용은 심층적인 변경 분석을 위해 DataFrame을 나란히 효율적으로 비교하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.