Pandas pd.read_excel()을 사용하여 Excel 데이터 로드를 위한 특정 시트 선택
Python에서 다중 시트 Excel 통합 문서로 작업할 때 다음과 같습니다. 전체 파일을 다시 로드하지 않고 Pandas DataFrame에 특정 시트만 로드하고 싶은 경우가 많습니다. 특히 대용량 통합 문서의 경우 처리 시간을 크게 절약할 수 있습니다.
pd.read_excel() 함수를 사용하면 로드할 시트를 지정할 수 있습니다. 이는 sheet_name 매개변수를 문자열(시트 이름), 정수(시트 색인), 시트 이름/색인 목록 또는 없음으로 지정하여 달성됩니다.
sheet_name=None을 지정하는 옵션은 특히 그렇습니다. 여러 시트를 로드해야 할 때 유용합니다. 이 경우 Pandas는 키가 시트 이름/색인이고 값이 해당 DataFrame인 사전을 반환합니다.
또는 pd.ExcelFile() 함수를 사용하여 전체 통합 문서를 한 번에 열 수 있습니다. 이렇게 하면 전체 파일을 메모리로 읽지만 각 시트에 대한 파일을 다시 로드하지 않고도 여러 시트를 읽을 수 있습니다.
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
pd.ExcelFile() 접근 방식은 전체 통합 문서를 메모리로 읽습니다. , 매우 큰 통합 문서에는 적합하지 않을 수 있습니다. 이러한 경우 적절한 sheet_name 사양을 사용하는 pd.read_excel()이 더 효율적일 수 있습니다.
위 내용은 Pandas를 사용하여 Excel 파일에서 특정 시트를 효율적으로 로드하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!