在Python 中解碼URL 編碼的UTF-8 字串
使用URL 時,您可能會遇到使用UTF- 的編碼字串8 並使用URL 引用進行轉義。要從這些字串中提取正確的數據,您需要對它們進行解碼。
在 Python 2.7 中,您可以使用 urllib.unquote() 來解碼 URL 編碼的資料。但是,此方法會傳回字節,因此您需要進一步解碼它們:
<code class="python">from urllib import unquote url = unquote(url).decode('utf8')</code>
在Python 3 及更高版本中,urllib 套件已拆分為urllib.request、urllib.parse 和urllib.error 。要解碼 URL 編碼數據,您應該使用 urllib.parse.unquote():
<code class="python">from urllib.parse import unquote url = unquote(url)</code>
此方法處理 URL 編碼和 UTF-8 解碼,並為您提供一個 unicode 字串作為結果。
例如:
<code class="python">>>> from urllib.parse import unquote >>> url = 'example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0' >>> unquote(url) 'example.com?title=правовая+защита'</code>
透過使用 urllib.parse.unquote(),您可以輕鬆解碼 URL 編碼的 UTF-8 字串,確保您獲得正確的資料。
以上是如何在 Python 中解碼 URL 編碼的 UTF-8 字串?的詳細內容。更多資訊請關注PHP中文網其他相關文章!