>백엔드 개발 >파이썬 튜토리얼 >여러 CSV 파일을 단일 Pandas DataFrame으로 효율적으로 결합하려면 어떻게 해야 합니까?

여러 CSV 파일을 단일 Pandas DataFrame으로 효율적으로 결합하려면 어떻게 해야 합니까?

Barbara Streisand
Barbara Streisand원래의
2024-12-18 08:45:10450검색

How Can I Efficiently Combine Multiple CSV Files into a Single Pandas DataFrame?

여러 CSV 파일을 읽고 단일 DataFrame으로 결합

문제 시나리오

작업은 디렉터리에서 여러 CSV 파일을 Pandas로 읽고 이를 하나의 DataFrame으로 결합합니다.

pandas 방법론

Pandas는 여러 데이터프레임을 연결하는 직관적인 방법을 제공합니다.

  • pd.concat(dfs,ignore_index=True): 원래 인덱스를 무시하고 데이터프레임을 수직으로 연결합니다.

구현

하려면 원하는 결과를 얻으면 각 CSV 파일을 데이터 프레임으로 읽어옵니다. 그런 다음 concat 방법을 사용하여 이러한 개별 데이터 프레임을 하나의 포괄적인 DataFrame으로 연결합니다.

코드 조각:

import glob
import pandas as pd

path = r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")

dfs = []
for filename in filenames:
    dfs.append(pd.read_csv(filename, header=0))

big_frame = pd.concat(dfs, ignore_index=True)

print(big_frame)

추가 참고 사항

  • concat에는 균일한 열이 필요하므로 모든 CSV 파일에 동일한 열이 있는지 확인하세요. 구조.
  • 추적을 위해 각 데이터 소스를 식별하는 열을 추가하는 것을 고려하세요.
  • 고급 파일 처리 기능을 위해 pathlib를 활용하세요.

위 내용은 여러 CSV 파일을 단일 Pandas DataFrame으로 효율적으로 결합하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.