Maison  >  Article  >  développement back-end  >  Comment décoder les URL codées en UTF-8 en Python ?

Comment décoder les URL codées en UTF-8 en Python ?

Linda Hamilton
Linda Hamiltonoriginal
2024-11-04 06:51:02898parcourir

How to Decode UTF-8 Encoded URLs in Python?

Décodage des URL codées en UTF-8 en Python

En Python, décoder une URL codée en UTF-8 peut être une tâche simple. Imaginons un scénario dans lequel vous disposez d'une chaîne d'URL telle que "example.com?title=правовая защита" qui doit être décodée en "example.com?title==правовая защита".

La clé pour décoder de telles URL réside dans la compréhension de la méthode d’encodage. Dans ce cas, les données sont des octets codés en UTF-8 qui ont été échappés avec des guillemets d'URL. Pour décoder ces données, nous utiliserons la fonction urllib.parse.unquote() de Python, qui gère le décodage des données codées en pourcentage en octets UTF-8, puis en texte de manière transparente.

<code class="python">from urllib.parse import unquote

url = unquote(url)</code>

Ce code décodera l'URL sous sa forme prévue :

example.com?title=правовая+защита

Pour Python 2, la fonction équivalente est urllib.unquote(), mais cela renvoie une chaîne d'octets qui nécessite un décodage manuel :

<code class="python">from urllib import unquote

url = unquote(url).decode('utf8')</code>

Par en suivant ces étapes, vous pouvez décoder efficacement les URL codées en UTF-8 en Python, vous permettant d'accéder et d'utiliser les données prévues.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn