Maison  >  Article  >  développement back-end  >  Python implémente le codage d'URL de conversion chinois

Python implémente le codage d'URL de conversion chinois

高洛峰
高洛峰original
2017-03-03 13:07:451632parcourir

L'exemple de cet article décrit comment Python implémente le codage d'URL de conversion chinoise. Partagez-le avec tout le monde pour votre référence, les détails sont les suivants :

Aujourd'hui, je dois m'occuper de choses sur Baidu Tieba. Si vous souhaitez créer une liste de mots-clés, ajoutez-les simplement directement à la liste chaque fois que vous en avez besoin. Cependant, si l'URL ajoutée à la liste est en chinois (par exemple « Lijiang »), le code d'adresse de l'URL est « Lijiang », une conversion est donc requise. Ici nous utilisons le module urllib.

>>> import urllib
>>> data = '丽江'
>>> print data
丽江
>>> data
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> urllib.quote(data)
'%E4%B8%BD%E6%B1%9F'

Et si nous voulons revenir en arrière ?

>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
丽江

Les étudiants attentifs constateront que ���� apparaît dans l'URL Tieba au lieu de « Lijiang », ce qui est en fait un problème d'encodage. Celui de Baidu est gbk et d'autres sites Web généraux tels que Google sont utf8. Cela peut donc être réalisé en utilisant les déclarations suivantes.

>>> import sys,urllib 
>>> s = '丽江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>

Pour plus d'articles liés à Python implémentant le codage d'URL de conversion chinois, veuillez faire attention au site Web PHP chinois !

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn