Pandas를 사용한 효율적인 워크시트 선택
대규모 스프레드시트로 작업할 때는 불필요한 데이터 로드를 피하기 위해 코드를 최적화하는 것이 중요합니다. 이 질문은 전체 파일을 여러 번 다시 로드하지 않고 pd.read_excel()을 사용하여 Excel 파일의 특정 워크시트를 읽는 문제를 해결합니다.
이 문제를 해결하기 위한 해결책은 pd.ExcelFile을 사용하는 것입니다. 이 클래스는 Excel 파일을 한 번 읽고 개별 워크시트에 액세스할 수 있는 인터페이스를 제공합니다. 예는 다음과 같습니다.
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
ExcelFile() 호출 중에 전체 파일을 읽는다는 점에 유의하는 것이 중요합니다. 그러나 동일한 파일 객체를 사용하여 pd.read_excel()을 후속 호출하려면 지정된 워크시트에만 액세스해야 합니다.
pd.read_excel()의 sheet_name 인수는 시트 이름에 대한 문자열, 시트에 대한 정수를 허용합니다. 번호 또는 이름이나 색인 목록. 기본값은 첫 번째 워크시트를 나타내는 0입니다.
모든 시트를 로드하려면 sheet_name=None을 지정합니다. 이는 키가 시트 이름/색인이고 값이 해당 데이터 프레임인 사전을 반환합니다.
위 내용은 Pandas를 사용하여 Excel 파일에서 특정 워크시트를 효율적으로 선택하고 읽을 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!