ホームページ >バックエンド開発 >Python チュートリアル >Python で URL エンコードされた UTF-8 文字列をデコードする方法

Python で URL エンコードされた UTF-8 文字列をデコードする方法

Patricia Arquette
Patricia Arquetteオリジナル
2024-11-04 01:49:30828ブラウズ

How to Decode URL-Encoded UTF-8 Strings in Python?

Python で URL エンコードされた UTF-8 文字列をデコードする

URL を使用する場合、UTF を使用してエンコードされた文字列が表示される場合があります。 8 を実行し、URL 引用符でエスケープしました。これらの文字列から正しいデータを抽出するには、文字列をデコードする必要があります。

Python 2.7 では、urllib.unquote() を使用して URL エンコードされたデータをデコードできます。ただし、このメソッドはバイトを返すため、さらにバイトをデコードする必要があります。

<code class="python">from urllib import unquote

url = unquote(url).decode('utf8')</code>

Python 3 以降では、urllib パッケージは urllib.request、urllib.parse、および urllib.error に分割されています。 URL エンコードされたデータをデコードするには、urllib.parse.unquote():

<code class="python">from urllib.parse import unquote

url = unquote(url)</code>

このメソッドは URL エンコードと UTF-8 デコードの両方を処理し、結果として Unicode 文字列を提供します。

例:

<code class="python">>>> from urllib.parse import unquote
>>> url = 'example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0'
>>> unquote(url)
'example.com?title=правовая+защита'</code>

urllib.parse.unquote() を使用すると、URL エンコードされた UTF-8 文字列を簡単にデコードでき、正しいデータを確実に取得できます。

以上がPython で URL エンコードされた UTF-8 文字列をデコードする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。