Maison  >  Article  >  développement back-end  >  Comment décoder les chaînes codées en URL UTF-8 dans Python 2.7 ?

Comment décoder les chaînes codées en URL UTF-8 dans Python 2.7 ?

Barbara Streisand
Barbara Streisandoriginal
2024-11-04 07:33:02889parcourir

How to Decode UTF-8 URL Encoded Strings in Python 2.7?

Url décoder UTF-8 en Python

Problème : étant donné une URL codée au format UTF-8, comment peut-il être décodé selon la représentation sous forme de chaîne prévue dans Python 2.7 ?

Solution :

Le problème provient de la présence d'octets codés en UTF-8 qui sont échappés avec l'URL citant. Pour décoder correctement ces données, un processus en deux étapes est requis :

  1. Décodage d'URL : Utilisez urllib.parse.unquote() en Python 3 ou urllib.unquote() en Python 2 pour reconvertir les octets codés en URL dans leur représentation d'origine.
  2. Décodage UTF-8 : Pour Python 2, la chaîne d'octets décodée doit être explicitement convertie en chaîne de texte à l'aide de décodage. ("utf8").
<code class="python">from urllib.parse import unquote

url = 'example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0'
decoded_url = unquote(url)

print(decoded_url)  # Output: example.com?title=правовая+защита</code>

Cette approche gère de manière transparente le décodage des données codées en pourcentage vers les octets UTF-8 et enfin vers le texte.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn