Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Membetulkan UnicodeDecodeError Semasa Membaca Fail CSV dalam Pandas?

Bagaimanakah Saya Boleh Membetulkan UnicodeDecodeError Semasa Membaca Fail CSV dalam Pandas?

Mary-Kate Olsen
Mary-Kate Olsenasal
2024-12-15 09:00:23259semak imbas

How Can I Fix a UnicodeDecodeError When Reading a CSV File in Pandas?

UnicodeDecodeError Semasa Membaca Fail CSV dalam Panda

Apabila memproses sejumlah besar fail serupa, menghadapi UnicodeDecodeError boleh mengecewakan. Ralat khusus ini, yang berpunca daripada kaedah read_csv Pandas, menunjukkan ketidakupayaan untuk menyahkod bait dalam fail menggunakan pengekodan UTF-8.

Untuk menyelesaikan isu ini, Pandas menyediakan pilihan pengekodan, membolehkan anda menentukan pengekodan format fail. Pengekodan yang biasa digunakan termasuk:

  • UTF-8: encoding="utf-8"
  • ISO-8859-1: encoding="ISO-8859-1" (bersamaan dengan " latin" atau "cp1252")

Untuk kebanyakan fail, menggunakan Pengekodan UTF-8 sudah memadai.

Contoh Kod:

import pandas as pd

filepath = 'filepath.csv'
data = pd.read_csv(filepath, encoding="utf-8")

Jika pengesanan pengekodan fail diperlukan, pertimbangkan untuk menggunakan alatan seperti enca, file -i (Linux ), atau fail -I (macOS). Pengekodan kemudiannya boleh ditentukan dengan sewajarnya.

Dengan menggunakan pilihan pengekodan, anda boleh memastikan penyahkodan fail CSV yang betul dan mengelakkan ralat yang tidak dijangka daripada mengganggu proses import data anda.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membetulkan UnicodeDecodeError Semasa Membaca Fail CSV dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn