Maison  >  Questions et réponses  >  le corps du texte

java - problème d'expression régulière

Je souhaite utiliser des expressions régulières pour extraire les informations suivantes. Comment dois-je l'écrire ?

123 男 北京          张三
343 女 河北 石家庄   李四
2343 男 山东         王五



提取 男 张三
     女 李四
     男 王五
ringa_leeringa_lee2684 Il y a quelques jours882

répondre à tous(1)je répondrai

  • PHP中文网

    PHP中文网2017-06-14 10:55:06

    En fait, pour le chinois, notamment le chinois dans ce format, je ne recommande pas d'utiliser des expressions régulières, même si cela peut être difficilement réalisable :

    # coding: utf8
    import re
    filename = '2.txt'
    patern = re.compile(r'^\d+ (\S+).*?(\S+)')
    with open(filename) as f:
        for i in f:
            result = patern.findall(i[:-1])
        
            if result and len(result[0]) == 2:
                print result[0][0], result[0][1]
                
    # 输出:
    男 北京
    女 河北
    男 山东

    Vous pouvez également utiliser split的方法(建议):

    # coding: utf8
    filename = '2.txt'
    with open(filename) as f:
        for i in f:
            result = i.split()
            print result[1], result[-1]
        
    # 输出:
    男 北京
    女 河北
    男 山东

    répondre
    0
  • Annulerrépondre