Heim >Backend-Entwicklung >Python-Tutorial >Wie dekodiere ich UTF-8-URL-codierte Zeichenfolgen in Python 2.7?

Wie dekodiere ich UTF-8-URL-codierte Zeichenfolgen in Python 2.7?

Barbara Streisand
Barbara StreisandOriginal
2024-11-04 07:33:02947Durchsuche

How to Decode UTF-8 URL Encoded Strings in Python 2.7?

URL UTF-8 in Python dekodieren

Problem: Wie geht das bei einer im UTF-8-Format codierten URL? Kann es in Python 2.7 in die beabsichtigte String-Darstellung dekodiert werden?

Lösung:

Das Problem ergibt sich aus dem Vorhandensein von UTF-8-codierten Bytes, die mit URL maskiert werden zitieren. Um diese Daten korrekt zu dekodieren, ist ein zweistufiger Prozess erforderlich:

  1. URL-Dekodierung: Verwenden Sie urllib.parse.unquote() in Python 3 oder urllib.unquote() in Python 2, um die URL-kodierten Bytes zurück in ihre ursprüngliche Darstellung zu konvertieren.
  2. UTF-8-Dekodierung: Für Python 2 muss der dekodierte Bytestring mithilfe von Dekodieren explizit in einen Textstring konvertiert werden ('utf8').
<code class="python">from urllib.parse import unquote

url = 'example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0'
decoded_url = unquote(url)

print(decoded_url)  # Output: example.com?title=правовая+защита</code>

Dieser Ansatz übernimmt nahtlos die Dekodierung von prozentcodierten Daten in UTF-8-Bytes und schließlich in Text.

Das obige ist der detaillierte Inhalt vonWie dekodiere ich UTF-8-URL-codierte Zeichenfolgen in Python 2.7?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn