Heim >Backend-Entwicklung >Python-Tutorial >Wie behebe ich den „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' von Pandas in CSV-Dateien?

Wie behebe ich den „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' von Pandas in CSV-Dateien?

Barbara Streisand
Barbara StreisandOriginal
2024-12-21 10:26:09226Durchsuche

How to Fix Pandas'

So beheben Sie „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten“ beim Lesen einer CSV-Datei

Beim Arbeiten mit einer CSV-Datei mit Pandas, möglicherweise tritt der Fehler „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten“ auf. Dieser spezielle Fehler tritt auf, wenn die CSV-Datei eine ungleiche Anzahl von Feldern in einer Zeile enthält, was zu einem Analysefehler führt.

Verstehen der Ursache:

Die Fehlermeldung weist darauf hin Der Parser erwartete zwei Felder in einer bestimmten Zeile, fand aber stattdessen 12. Diese Diskrepanz zwischen der erwarteten und der tatsächlichen Anzahl von Feldern führt zu dem Fehler.

Lösung des Problems:

Es gibt zwei primäre Möglichkeiten, dieses Problem zu beheben:

  1. Schlechtes Handling Zeilen:

    • on_bad_lines='skip': Diese Option weist Pandas an, die fehlerhaften Zeilen mit ungültigen Daten zu überspringen, sodass Sie den Rest der Datei fehlerfrei lesen können .
    • on_bad_lines='warn': Diese Option generiert Warnungen für das Ungültige Linien, die auf deren Vorhandensein hinweisen und es Ihnen ermöglichen, das Ausmaß des Problems einzuschätzen. Für eine erweiterte Behandlung können Sie eine aufrufbare Funktion übergeben.
  2. Fehlerbehandlung:

    • error_bad_lines=False : (für Pandas-Versionen unter 1.3.0) Diese Option unterdrückt den Fehler vollständig und ermöglicht Ihnen das Lesen gesamte Datei, einschließlich der ungültigen Zeilen. Es werden jedoch keine Informationen zu den ungültigen Zeilen bereitgestellt.

Beispielcode:

Als Beispiel, wenn Sie es hätten den folgenden Code:

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path)

Um den Fehler zu behandeln, können Sie den Code wie folgt ändern folgt:

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path, on_bad_lines='skip')

Mit einem dieser Ansätze können Sie die CSV-Datei trotz ungültiger Zeilen lesen und so sicherstellen, dass Ihre Pandas-Vorgänge reibungslos ablaufen

Das obige ist der detaillierte Inhalt vonWie behebe ich den „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' von Pandas in CSV-Dateien?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn