>백엔드 개발 >파이썬 튜토리얼 >Pandas를 사용하여 Excel 파일에서 특정 시트를 효율적으로 로드하려면 어떻게 해야 합니까?

Pandas를 사용하여 Excel 파일에서 특정 시트를 효율적으로 로드하려면 어떻게 해야 합니까?

Barbara Streisand
Barbara Streisand원래의
2024-12-11 05:13:11302검색

How Can I Efficiently Load Specific Sheets from an Excel File Using Pandas?

Pandas pd.read_excel()을 사용하여 Excel 데이터 로드를 위한 특정 시트 선택

Python에서 다중 시트 Excel 통합 문서로 작업할 때 다음과 같습니다. 전체 파일을 다시 로드하지 않고 Pandas DataFrame에 특정 시트만 로드하고 싶은 경우가 많습니다. 특히 대용량 통합 문서의 경우 처리 시간을 크게 절약할 수 있습니다.

pd.read_excel() 함수를 사용하면 로드할 시트를 지정할 수 있습니다. 이는 sheet_name 매개변수를 문자열(시트 이름), 정수(시트 색인), 시트 이름/색인 목록 또는 없음으로 지정하여 달성됩니다.

sheet_name=None을 지정하는 옵션은 특히 그렇습니다. 여러 시트를 로드해야 할 때 유용합니다. 이 경우 Pandas는 키가 시트 이름/색인이고 값이 해당 DataFrame인 사전을 반환합니다.

또는 pd.ExcelFile() 함수를 사용하여 전체 통합 문서를 한 번에 열 수 있습니다. 이렇게 하면 전체 파일을 메모리로 읽지만 각 시트에 대한 파일을 다시 로드하지 않고도 여러 시트를 읽을 수 있습니다.

xls = pd.ExcelFile('path_to_file.xls')
df1 = pd.read_excel(xls, 'Sheet1')
df2 = pd.read_excel(xls, 'Sheet2')

pd.ExcelFile() 접근 방식은 전체 통합 문서를 메모리로 읽습니다. , 매우 큰 통합 문서에는 적합하지 않을 수 있습니다. 이러한 경우 적절한 sheet_name 사양을 사용하는 pd.read_excel()이 더 효율적일 수 있습니다.

위 내용은 Pandas를 사용하여 Excel 파일에서 특정 시트를 효율적으로 로드하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.