Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich den UnicodeDecodeError von Pandas beim Lesen von CSV-Dateien beheben?

Wie kann ich den UnicodeDecodeError von Pandas beim Lesen von CSV-Dateien beheben?

Patricia Arquette
Patricia ArquetteOriginal
2025-01-03 21:45:40589Durchsuche

How Can I Fix Pandas' UnicodeDecodeError When Reading CSV Files?

Dekodierungsfehler beim Lesen von CSV-Dateien mit Pandas

Dieses Problem tritt beim Einlesen von CSV-Dateien in Pandas auf und führt zu folgendem Fehler:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte

Die zugrunde liegende Ursache liegt oft in Inkonsistenzen in der Kodierung der CSV Dateien.

Lösung

Um diesen Fehler zu beheben, stellt die Funktion read_csv einen Codierungsparameter bereit. Durch Angabe einer geeigneten Kodierung können Sie Pandas anweisen, die Datei korrekt zu interpretieren. Zu den häufig verwendeten Kodierungen gehören:

  • UTF-8:kodierung = "utf-8"
  • ISO-8859-1:kodierung = "ISO-8859-1"
  • Latin-1: Encoding = "Latin"
  • Windows-1252: Encoding = „cp1252“

Wenn die CSV-Dateien beispielsweise in ISO-8859-1 kodiert sind, können Sie den folgenden Code verwenden:

data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")

Bestimmen des Richtigen Kodierung

Wenn Sie sich über die richtige Kodierung nicht sicher sind, können Sie Tools wie Enca oder File verwenden um die Datei zu analysieren:

  • enca: Bietet einen detaillierten Bericht über die Kodierung der Datei.
  • Datei: Zeigt eine Kurzdarstellung an Beschreibung der Datei, einschließlich ihrer Kodierung.

Zusätzlich Ressourcen

  • [Pandas CSV-Dokumentation](https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html)
  • [Python CSV Datei Beispiele](https://www.pythonprogramming.net/parse-csv-python-file/)
  • [Unicode-Zeichen und Kodierungen](https://realpython.com/python-encodings-guide/)

Das obige ist der detaillierte Inhalt vonWie kann ich den UnicodeDecodeError von Pandas beim Lesen von CSV-Dateien beheben?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn