Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menyelesaikan 'pandas.parser.CParserError: Ralat token data' Semasa Membaca Fail CSV?

Bagaimana untuk Menyelesaikan 'pandas.parser.CParserError: Ralat token data' Semasa Membaca Fail CSV?

Barbara Streisand
Barbara Streisandasal
2024-12-23 15:49:14814semak imbas

How to Solve

Mengendalikan "pandas.parser.CParserError: Ralat token data" Semasa Membaca Fail CSV

"pandas.parser.CParserError: Ralat tokenizing data" ralat berlaku apabila panda menghadapi ketidakkonsistenan dalam bilangan medan dalam a talian CSV. Untuk menyelesaikan ralat ini dan memastikan manipulasi data lancar, pertimbangkan perkara berikut:

1. Semak Ralat Pengekodan

Semak fail CSV anda untuk sebarang ralat pengekodan, seperti pembatas medan yang tiada atau nilai yang tidak diformatkan dengan betul. Selain itu, semak sama ada fail mempunyai sambungan fail yang betul (cth., .csv).

2. Laraskan Pembatas CSV

Secara lalai, panda menggunakan koma sebagai pembatas untuk fail CSV. Walau bagaimanapun, jika fail CSV anda menggunakan pembatas yang berbeza (seperti koma bernoktah), tentukannya menggunakan parameter pembatas dalam read_csv().

3. Abaikan Garis Buruk

Jika anda menghadapi sebilangan kecil baris bermasalah, anda boleh mengarahkan panda untuk melangkaunya semasa membaca fail CSV. Anda boleh melakukan ini menggunakan parameter on_bad_lines='skip' dalam read_csv().

4. Gunakan Modul CSV

Sebagai alternatif kepada panda, anda boleh menggunakan modul csv Python untuk membaca dan menghuraikan fail CSV. Modul ini menyediakan lebih kawalan ke atas proses penghuraian, membolehkan anda mengendalikan ralat atau ketidakkonsistenan dengan lebih fleksibel.

Contoh:

Untuk menggunakan modul csv, anda boleh mencuba kod berikut:

with open(path, 'r') as csv_file:
    csv_reader = csv.reader(csv_file, delimiter=',')
    data = list(csv_reader)

Tambahan Petua:

  • Untuk versi Pandas kurang daripada 1.3.0, gunakan error_bad_lines=False untuk menyekat ralat.
  • Jika anda menjangkakan untuk menghadapi sejumlah besar garisan buruk, gunakan on_bad_lines='warn' atau boleh panggil tersuai untuk mengendalikannya dengan sewajarnya.
  • Pertimbangkan untuk mengesahkan Data CSV sebelum mengimportnya ke dalam panda untuk memastikan integritinya.

Atas ialah kandungan terperinci Bagaimana untuk Menyelesaikan 'pandas.parser.CParserError: Ralat token data' Semasa Membaca Fail CSV?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn