>백엔드 개발 >파이썬 튜토리얼 >Python에서 여러 CSV 파일을 단일 Pandas DataFrame으로 결합하려면 어떻게 해야 합니까?

Python에서 여러 CSV 파일을 단일 Pandas DataFrame으로 결합하려면 어떻게 해야 합니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-28 14:02:10890검색

How Can I Combine Multiple CSV Files into a Single Pandas DataFrame in Python?

Python에서 여러 CSV 파일을 단일 DataFrame으로 병합

이 작업의 목표는 디렉터리에서 여러 CSV 파일을 단일 Pandas DataFrame으로 가져오는 것입니다. 이를 수행하는 방법은 다음과 같습니다.

필요한 라이브러리 가져오기

먼저 파일 처리 및 데이터 조작에 필요한 라이브러리를 가져옵니다.

import pandas as pd
import glob
import os

CSV 파일 읽기 및 연결

CSV 파일을 읽고 연결하려면 다음을 따르세요. 단계:

  1. 파일 이름 가져오기: glob.glob()을 사용하여 지정된 디렉터리에 있는 CSV 파일 이름 목록을 가져옵니다.
  2. 읽기 파일 및 DataFrame 생성: 각 CSV 파일을 Pandas로 읽어옵니다. DataFrame.
  3. DataFrame 연결: pd.concat() 메서드를 사용하여 모든 DataFrame을 단일 DataFrame으로 연결합니다.

연결 코드

다음은 이를 결합한 예제 코드입니다. 단계:

# Get file names
path = r"C:\DRO\DCL_rawdata_files"
filenames = glob.glob(os.path.join(path, "*.csv"))

dfs = []
for filename in filenames:
    dfs.append(pd.read_csv(filename, header=0))

# Concatenate data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)

DataFrame에 ID 추가

다른 CSV 파일의 데이터를 구분하려면 새 열을 추가하여 각 파일을 식별할 수 있습니다. 이를 위한 몇 가지 옵션은 다음과 같습니다.

옵션 1: 파일 이름을 열로 추가

for df in dfs:
    df["file_name"] = df.file_name.str.split("\").str[-1].str.split(".")[0]

옵션 2: 파일 소스를 열로 추가 칼럼

df["Source"] = np.repeat([f"File{i}" for i in range(len(dfs))], [len(df) for df in dfs])

결론

이 단계를 따르면 여러 CSV 파일을 Python의 응집력 있는 단일 DataFrame으로 효율적으로 가져올 수 있으므로 다양한 데이터를 쉽게 분석하고 처리할 수 있습니다. 출처.

위 내용은 Python에서 여러 CSV 파일을 단일 Pandas DataFrame으로 결합하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.