Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana Mengendalikan Amaran Dtype Panda: Low_Memory dan Pilihan Dtype?
Apabila memuatkan fail CSV dengan Pandas menggunakan pd.read_csv('somefile.csv'), anda mungkin akan menghadapi amaran:
DtypeWarning: Columns (4,5,7,16) have mixed types. Specify dtype option on import or set low_memory=False.
Pilihan low_memory sudah lapuk dan tidak mempunyai kesan fungsian. Tujuannya adalah untuk mengurangkan penggunaan memori semasa menghurai fail dengan menghalang inferens jenis. Walau bagaimanapun, ia kini tidak melakukan apa-apa yang berbeza.
Amaran itu timbul kerana meneka djenis untuk setiap lajur memerlukan sumber yang intensif. Pandas menentukan dtypes dengan menganalisis keseluruhan fail. Tanpa mentakrifkan dtypes secara eksplisit, ia tidak boleh mula menghuraikan sehingga fail penuh dibaca.
Menentukan dtypes (cth., dtype={'user_id': int}) memberitahu Pandas tentang jenis data yang dijangkakan, membolehkannya mula menghuraikan serta-merta.
pd.read_csv('somefile.csv', dtype={'user_id': int})
Mendefinisikan djenis boleh mengelakkan ralat apabila menemui jenis data yang tidak sah (cth., "foobar" dalam lajur integer).
Pandas menyokong pelbagai dtypes, termasuk:
Khusus Panda:
UntukGunakan penukar untuk mengendalikan data yang mungkin tidak sah (cth., "foobar" dalam lajur integer). Walau bagaimanapun, penukar adalah perlahan dan tidak cekap, jadi gunakannya dengan berhati-hati.
Atas ialah kandungan terperinci Bagaimana Mengendalikan Amaran Dtype Panda: Low_Memory dan Pilihan Dtype?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!