Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Membetulkan UnicodeDecodeError Pandas Apabila Membaca Fail CSV?
Ralat Penyahkodan Ditemui Semasa Membaca Fail CSV dengan Panda
Isu ini timbul apabila membaca fail CSV ke dalam Panda, mengakibatkan ralat berikut:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
Punca asas selalunya disebabkan oleh ketidakkonsistenan dalam pengekodan Fail CSV.
Penyelesaian
Untuk menyelesaikan ralat ini, fungsi read_csv menyediakan parameter pengekodan. Dengan menentukan pengekodan yang sesuai, anda boleh mengarahkan Pandas untuk mentafsir fail dengan betul. Pengekodan yang biasa digunakan termasuk:
Sebagai contoh, jika fail CSV dikodkan dalam ISO-8859-1, anda boleh menggunakan kod berikut:
data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
Menentukan Pengekodan Betul
Jika anda tidak pasti pengekodan yang betul, anda boleh menggunakan alatan seperti enca atau fail untuk menganalisis fail:
Tambahan Sumber
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membetulkan UnicodeDecodeError Pandas Apabila Membaca Fail CSV?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!