python - 我該怎麼寫正規?

Question

s = u'\ud83d\udc8b'co = re.compile( u'\ud83d\udc8b')co.sub(u'',s)print(u'ud83d') 輸出如下UnicodeEncodeError: 'utf-8' codec無法在位置0 中編碼字元“ud83d”：不允許代理s中大...

高洛峰 · Answer

首先，是2個問題
1.為什麼顯示不出來
2.想替換掉但是為什麼匹配不到

回答
1.特殊編碼在終端上是無法顯示的，如果是在UI上顯示，那麼需要把UI的encoding設定好。
2.試試下面的程式碼

import re
s = u'hello \ud83d\udc8b world'
co = re.compile( u'\ud83d\udc8b')
ss = co.sub(u'',s)
print(ss)

運行結果：
hello world

黄舟 · Answer

我都是抄的