ホームページ >バックエンド開発 >Python チュートリアル >Pandas を使用して Excel ファイルから特定のシートを効率的にロードするにはどうすればよいですか?

Pandas を使用して Excel ファイルから特定のシートを効率的にロードするにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-12-11 05:13:11299ブラウズ

How Can I Efficiently Load Specific Sheets from an Excel File Using Pandas?

Pandas を使用した Excel データ読み込み用の特定のシートの選択 pd.read_excel()

Python で複数シートの Excel ワークブックを操作する場合、ファイル全体を再ロードせずに、特定のシートのみを Pandas DataFrame にロードしたいことがよくあります。これにより、特に大きなワークブックの場合、処理時間を大幅に節約できます。

pd.read_excel() 関数を使用すると、ロードするシートを指定できます。これは、sheet_name パラメータを文字列 (シート名)、整数 (シート インデックス)、シート名/インデックスのリスト、または None として指定することによって実現されます。

sheet_name=None を指定するオプションは特に重要です。複数のシートをロードする必要がある場合に便利です。この場合、Pandas は、キーがシート名/インデックス、値が対応する DataFrame であるディクショナリを返します。

または、pd.ExcelFile() 関数を使用して、ワークブック全体を一度に開くこともできます。これにより、ファイル全体がメモリに読み込まれますが、シートごとにファイルを再ロードすることなく、複数のシートを読み込むことができます。

xls = pd.ExcelFile('path_to_file.xls')
df1 = pd.read_excel(xls, 'Sheet1')
df2 = pd.read_excel(xls, 'Sheet2')

pd.ExcelFile() アプローチでは、ワークブック全体がメモリに読み込まれることに注意してください。これは、非常に大きなワークブックには理想的ではない可能性があります。このような場合、適切なsheet_nameを指定したpd.read_excel()の方が効率的です。

以上がPandas を使用して Excel ファイルから特定のシートを効率的にロードするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。