Heim  >  Artikel  >  Backend-Entwicklung  >  Python teilt gemischte chinesische und englische Zeichenfolgen

Python teilt gemischte chinesische und englische Zeichenfolgen

高洛峰
高洛峰Original
2016-10-19 13:48:263810Durchsuche


#coding=utf-8
import re
s = 'hi新手oh'.decode('utf-8') #举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码
p = re.compile(ur'[\u4e00-\u9fa5]') #这里是精髓,[\u4e00-\u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur
   
print p.split(s) #使用re库的split切割

   


Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Vorheriger Artikel:Peinlich an der KommandozeileNächster Artikel:Peinlich an der Kommandozeile