Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Memuatkan Lembaran Kerja Khusus dengan Cekap dari Fail Excel Besar dengan Panda?

Bagaimanakah Saya Boleh Memuatkan Lembaran Kerja Khusus dengan Cekap dari Fail Excel Besar dengan Panda?

DDD
DDDasal
2024-11-29 01:36:12671semak imbas

How Can I Efficiently Load Specific Worksheets from a Large Excel File with Pandas?

Memuatkan Lembaran Kerja Khusus dari Buku Kerja Dengan Cekap dengan Panda

Fungsi pd.read_excel() Panda ialah alat yang berkuasa untuk membaca buku kerja Excel. Walau bagaimanapun, apabila bekerja dengan fail besar yang mengandungi berbilang lembaran kerja, memuatkan keseluruhan buku kerja boleh menjadi tidak cekap, terutamanya jika anda hanya memerlukan data daripada beberapa helaian tertentu.

Memahami Proses Memuatkan dengan pd.read_excel( )

Apabila menggunakan pd.read_excel() pada lembaran kerja tertentu, nampaknya keseluruhan buku kerja adalah dimuatkan ke dalam ingatan. Ini kerana panda secara dalaman menggunakan objek ExcelFile untuk mewakili buku kerja. Objek ExcelFile menghuraikan keseluruhan fail semasa pemulaannya, tanpa mengira lembaran kerja yang ditentukan.

Memuatkan Helaian Khusus Dengan Cekap

Untuk mengoptimumkan proses pemuatan, pertimbangkan untuk menggunakan pd Objek .ExcelFile secara langsung. Dengan menjadikan objek ExcelFile dengan laluan buku kerja, anda boleh mengakses lembaran kerja tertentu tanpa memuatkan semula keseluruhan fail.

Sebagai contoh:

xls = pd.ExcelFile('path_to_file.xls')
df1 = pd.read_excel(xls, 'Sheet1')
df2 = pd.read_excel(xls, 'Sheet2')

Pendekatan ini memuatkan keseluruhan buku kerja sekali sahaja semasa penciptaan daripada objek ExcelFile. Panggilan seterusnya ke pd.read_excel() akan mendapatkan semula data daripada lembaran kerja yang ditentukan tanpa menanggung overhed memuatkan semula fail.

Memuatkan Berbilang Helaian

Selain itu, anda boleh menentukan senarai nama helaian atau indeks ke pd.read_excel() untuk memuatkan berbilang helaian serentak. Ini mengembalikan kamus yang kuncinya ialah nama atau indeks helaian dan nilainya ialah bingkai data yang sepadan.

Contohnya:

sheet_list = ['Sheet1', 'Sheet2']
df_dict = pd.read_excel(xls, sheet_list)

Memuatkan Semua Helaian

Jika anda perlu memuatkan semua lembaran kerja dalam buku kerja, tetapkan parameter sheet_name kepada Tiada:

df_dict = pd.read_excel(xls, sheet_name=None)

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memuatkan Lembaran Kerja Khusus dengan Cekap dari Fail Excel Besar dengan Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn