Heim > Artikel > Backend-Entwicklung > Wie dekodiere ich UTF-8-kodierte URLs in Python?
Dekodierung von UTF-8-kodierten URLs in Python
In Python kann die Dekodierung einer mit UTF-8 kodierten URL eine unkomplizierte Aufgabe sein. Stellen Sie sich ein Szenario vor, in dem Sie eine URL-Zeichenfolge wie „example.com?title=правовая защита“ haben, die in „example.com?title==правовая защита“ dekodiert werden muss.
Der Schlüssel zum Dekodieren solcher URLs liegt im Verständnis der Kodierungsmethode. In diesem Fall handelt es sich bei den Daten um UTF-8-codierte Bytes, die mit URL-Anführungszeichen maskiert wurden. Um diese Daten zu dekodieren, verwenden wir die Funktion urllib.parse.unquote() von Python, die die Dekodierung von prozentkodierten Daten in UTF-8-Bytes und dann nahtlos in Text übernimmt.
<code class="python">from urllib.parse import unquote url = unquote(url)</code>
Dieser Code wird dekodiert die URL in die vorgesehene Form:
example.com?title=правовая+защита
Für Python 2 ist die entsprechende Funktion urllib.unquote(), diese gibt jedoch einen Bytestring zurück, der eine manuelle Dekodierung erfordert:
<code class="python">from urllib import unquote url = unquote(url).decode('utf8')</code>
By Wenn Sie diese Schritte befolgen, können Sie UTF-8-codierte URLs in Python effektiv dekodieren, sodass Sie auf die gewünschten Daten zugreifen und diese nutzen können.
Das obige ist der detaillierte Inhalt vonWie dekodiere ich UTF-8-kodierte URLs in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!