>  기사  >  백엔드 개발  >  텍스트 파일을 반복할 때 UnicodeDecodeError: \'utf-8\' 코덱이 바이트를 디코딩할 수 없음이 발생하는 이유는 무엇입니까?

텍스트 파일을 반복할 때 UnicodeDecodeError: \'utf-8\' 코덱이 바이트를 디코딩할 수 없음이 발생하는 이유는 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-11-04 13:35:01992검색

Why am I getting a UnicodeDecodeError: 'utf-8' codec can't decode byte when iterating through a text file?

"for line in..." 결과 UnicodeDecodeError: 'utf-8' 코덱이 바이트를 디코딩할 수 없음

"for line in open('filename')" 구문을 사용하여 텍스트 파일의 행을 반복하면 프로그래머는 'utf-8' 코덱이 특정 바이트를 디코딩할 수 없음을 나타내는 UnicodeDecodeError를 경험할 수 있습니다. 이 오류는 일반적으로 텍스트 파일의 인코딩이 'utf-8' 코덱에서 가정한 인코딩과 일치하지 않을 때 발생합니다.

문제 해결

이 문제를 해결하려면 오류가 발생하면 텍스트 파일을 여는 동안 텍스트 파일의 올바른 인코딩을 지정해야 합니다. 이는 아래와 같이 open() 함수에 "encoding=" 매개변수를 추가하여 달성할 수 있습니다.

<code class="python">for line in open('filename', encoding='utf-8'):
    # Read each line</code>

어떤 경우에는 지정된 인코딩이 올바르지 않아 동일한 오류가 발생할 수 있습니다. 적절한 인코딩을 결정하기 위해 프로그래머는 텍스트 파일을 검사하고 사용된 문자 집합을 식별할 수 있습니다.

예를 들어 질문자가 제공한 코드 조각은 다음과 같습니다.

<code class="python">for line in open('u.item'):
    # Read each line</code>

디코딩에 실패했습니다. 인코딩이 'utf-8'로 잘못 가정되었기 때문입니다. 텍스트 파일을 검사한 결과 올바른 인코딩이 "ISO-8859-1"인 것으로 나타났습니다. 다음과 같이 코드를 수정하면 문제가 해결되었습니다.

<code class="python">for line in open('u.item', encoding='ISO-8859-1'):
    # Read each line</code>

위 내용은 텍스트 파일을 반복할 때 UnicodeDecodeError: \'utf-8\' 코덱이 바이트를 디코딩할 수 없음이 발생하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.