Maison > Questions et réponses > le corps du texte
Je souhaite utiliser des expressions régulières pour extraire les informations suivantes. Comment dois-je l'écrire ?
123 男 北京 张三
343 女 河北 石家庄 李四
2343 男 山东 王五
提取 男 张三
女 李四
男 王五
PHP中文网2017-06-14 10:55:06
En fait, pour le chinois, notamment le chinois dans ce format, je ne recommande pas d'utiliser des expressions régulières, même si cela peut être difficilement réalisable :
# coding: utf8
import re
filename = '2.txt'
patern = re.compile(r'^\d+ (\S+).*?(\S+)')
with open(filename) as f:
for i in f:
result = patern.findall(i[:-1])
if result and len(result[0]) == 2:
print result[0][0], result[0][1]
# 输出:
男 北京
女 河北
男 山东
Vous pouvez également utiliser split
的方法(建议
):
# coding: utf8
filename = '2.txt'
with open(filename) as f:
for i in f:
result = i.split()
print result[1], result[-1]
# 输出:
男 北京
女 河北
男 山东