首頁  >  文章  >  後端開發  >  如何在 Python 中解碼 URL 編碼的 UTF-8 字串?

如何在 Python 中解碼 URL 編碼的 UTF-8 字串?

Patricia Arquette
Patricia Arquette原創
2024-11-04 01:49:30730瀏覽

How to Decode URL-Encoded UTF-8 Strings in Python?

在Python 中解碼URL 編碼的UTF-8 字串

使用URL 時,您可能會遇到使用UTF- 的編碼字串8 並使用URL 引用進行轉義。要從這些字串中提取正確的數據,您需要對它們進行解碼。

在 Python 2.7 中,您可以使用 urllib.unquote() 來解碼 URL 編碼的資料。但是,此方法會傳回字節,因此您需要進一步解碼它們:

<code class="python">from urllib import unquote

url = unquote(url).decode('utf8')</code>

在Python 3 及更高版本中,urllib 套件已拆分為urllib.request、urllib.parse 和urllib.error 。要解碼 URL 編碼數據,您應該使用 urllib.parse.unquote():

<code class="python">from urllib.parse import unquote

url = unquote(url)</code>

此方法處理 URL 編碼和 UTF-8 解碼,並為您提供一個 unicode 字串作為結果。

例如:

<code class="python">>>> from urllib.parse import unquote
>>> url = 'example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0'
>>> unquote(url)
'example.com?title=правовая+защита'</code>

透過使用 urllib.parse.unquote(),您可以輕鬆解碼 URL 編碼的 UTF-8 字串,確保您獲得正確的資料。

以上是如何在 Python 中解碼 URL 編碼的 UTF-8 字串?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn