>백엔드 개발 >파이썬 튜토리얼 >Python의 For 루프 내에 여러 DataFrame을 효율적으로 추가하는 방법은 무엇입니까?

Python의 For 루프 내에 여러 DataFrame을 효율적으로 추가하는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-28 02:54:30724검색

How to Efficiently Append Multiple DataFrames within a For Loop in Python?

Python의 For 루프 내에 여러 데이터 프레임 추가

여러 Excel 파일에 저장된 대규모 데이터 세트로 작업할 때 통합이 필요한 경우가 많습니다. 추가 분석 또는 처리를 위해 모든 데이터를 단일 DataFrame으로 저장합니다. 이는 for 루프 내에서 Python의 pandas 라이브러리를 사용하여 쉽게 달성할 수 있습니다.

데이터프레임을 추가하려면 DataFrame.append() 메서드에 두 개 이상의 인수가 필요하다는 점에 유의하는 것이 중요합니다. 제공된 코드에서는 하나의 인수인 data만 전달됩니다. 올바른 접근 방식은 모든 DataFrame을 루프 내의 목록에 저장한 다음 pd.concat을 사용하여 목록을 단일 DataFrame으로 병합하는 것입니다.

자세한 설명은 다음과 같습니다.

<code class="python">import pandas as pd
import glob

# Initialize an empty list to store DataFrames
appended_data = []

# Iterate over Excel files in a specified directory
for infile in glob.glob("*.xlsx"):
    print("Processing file:", infile)
    
    # Read data from Excel file into a DataFrame
    data = pd.read_excel(infile)
    
    # Append DataFrame to the list
    appended_data.append(data)

# Concatenate DataFrames to create a consolidated DataFrame
final_df = pd.concat(appended_data, ignore_index=True)

# Save consolidated data to a new Excel file
final_df.to_excel('appended.xlsx', index=False)</code>

이 접근 방식을 따르면 for 루프 내에서 생성된 여러 DataFrame을 원활하게 추가하고 통합된 데이터를 새 Excel 파일에 저장할 수 있습니다. 이를 통해 크고 분리된 데이터 세트를 효율적이고 효과적으로 작업할 수 있습니다.

위 내용은 Python의 For 루프 내에 여러 DataFrame을 효율적으로 추가하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.