Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Memuatkan Helaian Khusus dengan Cekap daripada Fail Excel Menggunakan Panda?
Memilih Helaian Khusus untuk Pemuatan Data Excel dengan Pandas pd.read_excel()
Apabila bekerja dengan buku kerja Excel berbilang helaian dalam Python, ia adalah selalunya dikehendaki untuk memuatkan hanya helaian tertentu ke dalam Pandas DataFrame tanpa memuatkan semula keseluruhan fail. Ini boleh menjimatkan masa pemprosesan yang ketara, terutamanya untuk buku kerja yang besar.
Menggunakan fungsi pd.read_excel(), adalah mungkin untuk menentukan helaian untuk dimuatkan. Ini dicapai dengan menentukan parameter sheet_name sebagai sama ada rentetan (nama helaian), integer (indeks helaian), senarai nama helaian/indeks, atau Tiada.
Pilihan untuk menentukan sheet_name=Tiada terutamanya berguna apabila beberapa helaian perlu dimuatkan. Dalam kes ini, Pandas mengembalikan kamus yang mana kuncinya ialah nama/indeks helaian dan nilainya ialah DataFrames yang sepadan.
Sebagai alternatif, fungsi pd.ExcelFile() boleh digunakan untuk membuka keseluruhan buku kerja sekaligus. Ini membaca keseluruhan fail ke dalam memori, tetapi ia membenarkan berbilang helaian dibaca tanpa perlu memuat semula fail untuk setiap helaian.
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
Perhatikan bahawa pendekatan pd.ExcelFile() membaca keseluruhan buku kerja ke dalam memori , yang mungkin tidak sesuai untuk buku kerja yang sangat besar. Dalam kes sedemikian, pd.read_excel() dengan spesifikasi sheet_name yang sesuai boleh menjadi lebih cekap.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memuatkan Helaian Khusus dengan Cekap daripada Fail Excel Menggunakan Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!