ホームページ >バックエンド開発 >Python チュートリアル >Pandas を使用して Excel ファイルから特定のワークシートを効率的に選択して読み取るにはどうすればよいですか?
Pandas を使用した効率的なワークシートの選択
大規模なスプレッドシートを操作する場合、不必要なデータの読み込みを避けるためにコードを最適化することが重要です。この質問は、ファイル全体を複数回再ロードせずに、pd.read_excel() を使用して Excel ファイル内の特定のワークシートを読み取る問題を解決します。
これに対処するには、解決策は pd.ExcelFile を使用することにあります。このクラスは Excel ファイルを 1 回読み取り、個々のワークシートにアクセスするためのインターフェイスを提供します。以下に例を示します。
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
ExcelFile() 呼び出し中にファイル全体が読み取られることに注意することが重要です。ただし、同じファイル オブジェクトを使用した後続の pd.read_excel() の呼び出しでは、指定されたワークシートにアクセスするだけで済みます。
pd.read_excel() のsheet_name 引数は、シート名の文字列、シートの整数を受け入れます。番号、または名前やインデックスのリスト。デフォルトは 0 で、最初のワークシートを示します。
すべてのシートをロードするには、sheet_name=None を指定します。これは、キーがシート名/インデックス、値が対応するデータ フレームであるディクショナリを返します。
以上がPandas を使用して Excel ファイルから特定のワークシートを効率的に選択して読み取るにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。