"for line in..." 결과 UnicodeDecodeError: 'utf-8' 코덱이 바이트를 디코딩할 수 없음
"for line in open('filename')" 구문을 사용하여 텍스트 파일의 행을 반복하면 프로그래머는 'utf-8' 코덱이 특정 바이트를 디코딩할 수 없음을 나타내는 UnicodeDecodeError를 경험할 수 있습니다. 이 오류는 일반적으로 텍스트 파일의 인코딩이 'utf-8' 코덱에서 가정한 인코딩과 일치하지 않을 때 발생합니다.
문제 해결
이 문제를 해결하려면 오류가 발생하면 텍스트 파일을 여는 동안 텍스트 파일의 올바른 인코딩을 지정해야 합니다. 이는 아래와 같이 open() 함수에 "encoding=" 매개변수를 추가하여 달성할 수 있습니다.
<code class="python">for line in open('filename', encoding='utf-8'): # Read each line</code>
어떤 경우에는 지정된 인코딩이 올바르지 않아 동일한 오류가 발생할 수 있습니다. 적절한 인코딩을 결정하기 위해 프로그래머는 텍스트 파일을 검사하고 사용된 문자 집합을 식별할 수 있습니다.
예를 들어 질문자가 제공한 코드 조각은 다음과 같습니다.
<code class="python">for line in open('u.item'): # Read each line</code>
디코딩에 실패했습니다. 인코딩이 'utf-8'로 잘못 가정되었기 때문입니다. 텍스트 파일을 검사한 결과 올바른 인코딩이 "ISO-8859-1"인 것으로 나타났습니다. 다음과 같이 코드를 수정하면 문제가 해결되었습니다.
<code class="python">for line in open('u.item', encoding='ISO-8859-1'): # Read each line</code>
위 내용은 텍스트 파일을 반복할 때 UnicodeDecodeError: \'utf-8\' 코덱이 바이트를 디코딩할 수 없음이 발생하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!