Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengoptimumkan Panda `read_csv` dengan Pilihan `dtype` dan `low_memory`?
Apabila menggunakan pd.read_csv('somefile.csv'), anda mungkin menghadapi DtypeWarning menunjukkan bahawa lajur mempunyai jenis campuran. Menentukan pilihan dtype boleh menghalang ralat ini dan meningkatkan prestasi.
Pilihan low_memory yang ditamatkan sebenarnya tidak menjejaskan tingkah laku. Walau bagaimanapun, ia berkaitan dengan pilihan dtype kerana meneka dtype untuk setiap lajur boleh menjadi intensif memori.
Jika baris terakhir masuk fail anda mengandungi data yang tidak dijangka, menyatakan dtypes boleh menyebabkan proses pemuatan gagal. Contohnya, jika lajur yang dinyatakan sebagai integer mengandungi nilai rentetan seperti "foobar", pemuatan akan terputus.
Untuk mengelakkan ralat sedemikian, secara eksplisit tentukan dtypes apabila membaca fail CSV. Menggunakan pilihan dtype memberikan jenis data yang betul kepada setiap lajur, membolehkan penghuraian yang cekap dan mengurangkan penggunaan memori.
Panda menyokong pelbagai jenis d, termasuk :
Sambungan Pandas:
Atas ialah kandungan terperinci Bagaimana untuk Mengoptimumkan Panda `read_csv` dengan Pilihan `dtype` dan `low_memory`?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!