ホームページ >バックエンド開発 >Python チュートリアル >Pandas を使用して Excel ファイルから特定のシートを効率的にロードするにはどうすればよいですか?
Pandas を使用した Excel データ読み込み用の特定のシートの選択 pd.read_excel()
Python で複数シートの Excel ワークブックを操作する場合、ファイル全体を再ロードせずに、特定のシートのみを Pandas DataFrame にロードしたいことがよくあります。これにより、特に大きなワークブックの場合、処理時間を大幅に節約できます。
pd.read_excel() 関数を使用すると、ロードするシートを指定できます。これは、sheet_name パラメータを文字列 (シート名)、整数 (シート インデックス)、シート名/インデックスのリスト、または None として指定することによって実現されます。
sheet_name=None を指定するオプションは特に重要です。複数のシートをロードする必要がある場合に便利です。この場合、Pandas は、キーがシート名/インデックス、値が対応する DataFrame であるディクショナリを返します。
または、pd.ExcelFile() 関数を使用して、ワークブック全体を一度に開くこともできます。これにより、ファイル全体がメモリに読み込まれますが、シートごとにファイルを再ロードすることなく、複数のシートを読み込むことができます。
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
pd.ExcelFile() アプローチでは、ワークブック全体がメモリに読み込まれることに注意してください。これは、非常に大きなワークブックには理想的ではない可能性があります。このような場合、適切なsheet_nameを指定したpd.read_excel()の方が効率的です。
以上がPandas を使用して Excel ファイルから特定のシートを効率的にロードするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。