UnicodeEncodeError: 'ascii' 코덱의 비ASCII 문자와의 싸움
다양한 웹 페이지에서 텍스트를 가져올 때 수수께끼의 " UnicodeEncodeError"는 'ascii' 코덱이 특정 문자를 인코딩할 수 없음을 나타냅니다. 코드가 일부 페이지에서는 문제 없이 작동하지만 다른 페이지에서는 실패하는 이러한 불일치는 ASCII가 아닌 문자가 있기 때문에 발생하는 경우가 많습니다.
제공된 코드 조각에서 유니코드 문자열을 변환하려고 할 때 문제가 발생합니다. (' ' 문자 포함 가능성이 높음)을 'ascii'로 인코딩된 바이트 문자열로 변환합니다. 그러나 'ascii'는 이 문자를 나타낼 수 없으므로 "범위에 없는 서수(128)" 오류가 발생합니다.
인코딩 문제 제거
이 문제를 해결하려면 , 유니코드 문자열을 인코딩된 텍스트로 변환하기 위해 str()을 사용하는 관행을 포기하십시오. 대신 UTF-8과 같은 원하는 인코딩을 사용하여 문자열을 명시적으로 인코딩하는 .encode()의 기능을 활용하세요.
인코딩 솔루션의 예:
p.agent_info = u' '.join((agent_contact, agent_telno)).encode('utf-8').strip()
또는 유니코드의 세계를 완전히 수용하여 유니코드 문자열로만 작업하고 인코딩 및 디코딩의 필요성을 피할 수도 있습니다. 운영합니다.
위 내용은 웹 페이지 텍스트를 인코딩할 때 Python 코드에서 UnicodeEncodeError가 발생하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!