search

Home  >  Q&A  >  body text

正则表达式 - python正则匹配筛出来元组

抓人人相册图片
特征是src="URL" URL里包括large_和original_的
我本来是
flist=re.findall('src="(.*?large_.*?)"',str)
改成
flist=re.findall('src="(.*?(large_|original_).*?)"',str)
筛出来list里是元组
正则应该怎么写好

阿神阿神2787 days ago868

reply all(1)I'll reply

  • ringa_lee

    ringa_lee2017-04-17 10:59:42

    src="http://fmn.rrimg.com/fmn059/20111102/...
    随便看了下,还是没找到带original_的。

    (?<=src=")[^"]*?(?:large_|original_){1}[^"]*?(?=")

    应该可以,在你给的链接里面找到10个。

    reply
    0
  • Cancelreply