Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Memuatkan Lembaran Kerja Khusus Sahaja dengan Cekap daripada Fail Excel Besar Menggunakan Panda?

Bagaimanakah Saya Boleh Memuatkan Lembaran Kerja Khusus Sahaja dengan Cekap daripada Fail Excel Besar Menggunakan Panda?

Barbara Streisand
Barbara Streisandasal
2024-11-28 21:11:14669semak imbas

How Can I Efficiently Load Only Specific Worksheets from a Large Excel File Using Pandas?

Memuatkan Lembaran Kerja Khusus dari Fail Excel dengan Panda dengan Cekap

Dalam konteks menggunakan Panda untuk pemprosesan data, selalunya perlu untuk mengakses lembaran kerja tertentu daripada fail Excel . Walau bagaimanapun, apabila menggunakan fungsi pd.read_excel(), keseluruhan buku kerja tidak dapat dielakkan dimuatkan ke dalam ingatan. Ini boleh membawa kepada isu prestasi apabila berurusan dengan fail Excel yang besar.

Penyelesaian: Menggunakan pd.ExcelFile

Untuk mengatasi cabaran ini, Pandas menyediakan kelas pd.ExcelFile. Kelas ini membolehkan anda memuatkan fail Excel sekali dan mengakses lembaran kerja individu seperti yang diperlukan tanpa memuatkan semula keseluruhan fail. Begini cara untuk menggunakannya:

import pandas as pd

# Read the Excel file using pd.ExcelFile
xls = pd.ExcelFile('path_to_file.xlsx')

# Load specific worksheets
df1 = pd.read_excel(xls, 'Sheet1')
df2 = pd.read_excel(xls, 'Sheet2')

Kaveat

Adalah penting untuk ambil perhatian bahawa semasa menggunakan pd.ExcelFile mengelakkan beban berlebihan bagi keseluruhan buku kerja, ia masih memerlukan pemuatan awal fail. Ini bermakna bahawa untuk fail Excel yang sangat besar, penggunaan memori mungkin masih besar.

Pilihan untuk Memuatkan Berbilang Lembaran Kerja

Fungsi pd.read_excel() menyediakan pilihan untuk memuatkan berbilang lembaran kerja. Anda boleh menentukan senarai nama atau indeks helaian seperti berikut:

# Load multiple sheets as a dictionary
sheet_names = ['Sheet1', 'Sheet2']
multiple_sheets = pd.read_excel('path_to_file.xlsx', sheet_name=sheet_names)

Untuk memuatkan semua helaian dalam fail sebagai kamus, gunakan Tiada sebagai argumen sheet_name:

# Load all sheets as a dictionary
all_sheets = pd.read_excel('path_to_file.xlsx', sheet_name=None)

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memuatkan Lembaran Kerja Khusus Sahaja dengan Cekap daripada Fail Excel Besar Menggunakan Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn