Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich einen UnicodeDecodeError beim Lesen einer CSV-Datei in Pandas beheben?

Wie kann ich einen UnicodeDecodeError beim Lesen einer CSV-Datei in Pandas beheben?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-12-15 09:00:23259Durchsuche

How Can I Fix a UnicodeDecodeError When Reading a CSV File in Pandas?

UnicodeDecodeError beim Lesen einer CSV-Datei in Pandas

Bei der Verarbeitung einer großen Anzahl ähnlicher Dateien kann es frustrierend sein, auf einen UnicodeDecodeError zu stoßen. Dieser spezielle Fehler, der von der read_csv-Methode von Pandas herrührt, weist darauf hin, dass ein Byte in der Datei nicht mit der UTF-8-Kodierung dekodiert werden kann.

Um dieses Problem zu beheben, bietet Pandas die Kodierungsoption, mit der Sie die Kodierung angeben können Format der Datei. Zu den häufig verwendeten Kodierungen gehören:

  • UTF-8:kodierung="utf-8"
  • ISO-8859-1:kodierung="ISO-8859-1" (entspricht „ latin“ oder „cp1252“)

Für die meisten Dateien reicht die Verwendung der UTF-8-Kodierung aus ausreichen.

Codebeispiel:

import pandas as pd

filepath = 'filepath.csv'
data = pd.read_csv(filepath, encoding="utf-8")

Wenn die Erkennung der Dateikodierung erforderlich ist, sollten Sie die Verwendung von Tools wie enca, file -i (Linux) oder file - in Betracht ziehen. Ich (macOS). Die Kodierung kann dann entsprechend angegeben werden.

Durch die Verwendung der Kodierungsoption können Sie eine ordnungsgemäße Dekodierung von CSV-Dateien sicherstellen und verhindern, dass unerwartete Fehler Ihren Datenimportvorgang unterbrechen.

Das obige ist der detaillierte Inhalt vonWie kann ich einen UnicodeDecodeError beim Lesen einer CSV-Datei in Pandas beheben?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn