Python에서 URL 인코딩 UTF-8 문자열 디코딩
URL 작업 시 UTF-8을 사용하여 인코딩된 문자열을 접할 수 있습니다. 8 URL 인용으로 이스케이프되었습니다. 이러한 문자열에서 올바른 데이터를 추출하려면 해당 문자열을 디코딩해야 합니다.
Python 2.7에서는 urllib.unquote()를 사용하여 URL로 인코딩된 데이터를 디코딩할 수 있습니다. 그러나 이 메서드는 바이트를 반환하므로 추가로 디코딩해야 합니다.
<code class="python">from urllib import unquote url = unquote(url).decode('utf8')</code>
Python 3 이상에서는 urllib 패키지가 urllib.request, urllib.parse 및 urllib.error로 분할되었습니다. URL로 인코딩된 데이터를 디코딩하려면 urllib.parse.unquote()를 사용해야 합니다.
<code class="python">from urllib.parse import unquote url = unquote(url)</code>
이 메서드는 URL 인코딩과 UTF-8 디코딩을 모두 처리하여 결과적으로 유니코드 문자열을 제공합니다.
예:
<code class="python">>>> from urllib.parse import unquote >>> url = 'example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0' >>> unquote(url) 'example.com?title=правовая+защита'</code>
urllib.parse.unquote()를 사용하면 URL로 인코딩된 UTF-8 문자열을 쉽게 디코딩하여 올바른 데이터를 얻을 수 있습니다.
위 내용은 Python에서 URL로 인코딩된 UTF-8 문자열을 디코딩하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!