Home  >  Q&A  >  body text

python - 提取图片文件名,并替换<img>标签

本功能类似于将<img>标签替换成markdown格式的文本,要提取其中的文件名,并替换<img>标签。
如:

图片:<font color="#000000"><img width="147" height="52" src="http://127.0.0.1:80/admin/../upload/pimg1054_1.png" alt="" /></font></p> <img width="147" height="52" src="admin/../upload/asffas_ad.jpg" alt="" /><p style="margin-bottom: 0cm;">保留两位小数</p> </p>

替换结果为:

图片:<font color="#000000">pimg1054_1.png</font></p> asffas_ad.jpg<p style="margin-bottom: 0cm;">保留两位小数</p> </p>

我写的正则:

import re

a = '图片:<font color="#000000"><img width="147" height="52" src="http://127.0.0.1:80/JudgeOnline/admin/../upload/pimg1054_1.png" alt="" /></font></p> <img width="147" height="52" src="http://127.0.0.1:80/JudgeOnline/admin/../upload/asffas_ad.png" alt="" /><p style="margin-bottom: 0cm;">保留两位小数</p> </p>'
#re_img = re.compile('<\s*img.*src=[\"\']?.*?(\/\.[jpngif]+)[\"\']?.*\/>')
re_img = re.compile('''<\s*img.*src=["']?[\S]+\/([^\/]+\.[jpngif]+)["']?.*?>''')
s = re_img.sub(r'\1', a)

print(s)

貌似匹配了第一图片标签的<img和最后一个图片标签的/>,结果只保留了一个图片。
请问该怎么替换?

怪我咯怪我咯2763 days ago444

reply all(1)I'll reply

  • 迷茫

    迷茫2017-04-18 09:55:20

    import re
    
    reg='<img.*?src="(.*?\.(jpg|png))".*?/>'
    content='图片:<font color="#000000"><img width="147" height="52" src="http://127.0.0.1:80/admin/../upload/pimg1054_1.png" alt="" /></font></p> <img width="147" height="52" src="admin/../upload/asffas_ad.jpg" alt="" /><p style="margin-bottom: 0cm;">保留两位小数</p> </p>'
    m=re.search(reg,content)
    imgName=m.group(1).split('/')[-1]
    res=re.sub(reg,imgName.strip(),content)
    print(res)
    

    Is that so?

    reply
    0
  • Cancelreply