Heim >Backend-Entwicklung >Python-Tutorial >Wie löst man den Pandas-Fehler „pandas.parser.CParserError: Error tokenizing data' beim Lesen von CSV-Dateien?

Wie löst man den Pandas-Fehler „pandas.parser.CParserError: Error tokenizing data' beim Lesen von CSV-Dateien?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-12-08 22:04:12217Durchsuche

How to Solve the Pandas `pandas.parser.CParserError: Error tokenizing data` Error When Reading CSV Files?

Fehlerbehebung bei „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten“ für die Pandas-CSV-Analyse

Möglicherweise tritt der Fehler „pandas.parser.CParserError“ auf : Fehler bei der Tokenisierung der Daten bei Verwendung der pd.read_csv-Funktion des Pandas-Bibliothek, die auf eine Diskrepanz zwischen der erwarteten und der gefundenen Anzahl von Feldern in einer bestimmten Zeile der CSV-Datei hinweist.

Die Fehlermeldung impliziert, dass die Bibliothek zwei Felder in einer bestimmten Zeile (in diesem Fall Zeile 3) erwartet hat. aber stattdessen 12 gefunden. Diese Ungleichheit kann durch fehlerhafte Daten wie fehlende Werte oder zusätzliche Kommas in einem Feld entstehen.

Um das Problem zu beheben und mit der CSV-Analyse fortzufahren, ziehen Sie den folgenden Ansatz in Betracht:

Verwenden Sie die on_bad_lines Parameter:

data = pd.read_csv(path, on_bad_lines='skip')

Diese Methode überspringt die fehlerhaften Zeilen mit unerwarteten Feldern, sodass der Lesevorgang fortgesetzt werden kann.

Für eine erweiterte Behandlung ungültiger Zeilen implementieren Sie eine benutzerdefinierte aufrufbare Funktion definiert Aktionen, die ergriffen werden sollen, wenn fehlerhafte Leitungen erkannt werden.

Wenn Ihre Pandas-Version kleiner als 1.3.0 ist, können Sie den Parameter on_bad_lines durch ersetzen error_bad_lines:

data = pd.read_csv("file1.csv", error_bad_lines=False)

Diese Option überspringt auch die problematischen Zeilen, jedoch ohne dass ein Customcallable erforderlich ist.

Als Alternative zu Pandas können Sie die Erkundung mit dem CSV-Modul in Python durchführen, das grundlegende Dienstprogramme bereitstellt zum Parsen von CSV-Dateien. Es bietet jedoch möglicherweise nicht das gleiche Maß an Flexibilität und Funktionen wie Pandas.

Das obige ist der detaillierte Inhalt vonWie löst man den Pandas-Fehler „pandas.parser.CParserError: Error tokenizing data' beim Lesen von CSV-Dateien?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn