Maison > Questions et réponses > le corps du texte
s = u'ud83dudc8b'
co = re.compile( u'ud83dudc8b')
co.sub(u'',s)
print(u'ud83d')
Le résultat est le suivant
UnicodeEncodeError : le codec 'utf-8' ne peut pas encoder le caractère 'ud83d' en position 0 : les substituts ne sont pas autorisés
s est probablement une émoticône Weibo, mais après avoir travaillé dessus tout l'après-midi, je n'ai pas pu l'afficher, j'ai pensé à la remplacer, mais je n'ai pas pu la faire correspondre.
高洛峰2017-05-27 17:41:31
Tout d'abord, il y a 2 questions
1. Pourquoi ne peut-il pas être affiché ? 2. Je veux le remplacer mais pourquoi ne peut-il pas correspondre ?
Réponse
2. Essayez le code suivant
import re
s = u'hello \ud83d\udc8b world'
co = re.compile( u'\ud83d\udc8b')
ss = co.sub(u'',s)
print(ss)