本功能类似于将<img>标签替换成markdown格式的文本,要提取其中的文件名,并替换<img>标签。如:
图片:<font color="#000000"><img width="147" height="52"src="http://127.0.0.1:80/admin/../upload/pimg1054_1.png" alt="" /></font></p> <img width="147"height="52" src="admin/../upload/asffas_ad.jpg" alt="" /><p style="margin-bottom: 0cm;">保留两位小数</p></p>
替换结果为:
图片:<font color="#000000">pimg1054_1.png</font></p> asffas_ad.jpg<p style="margin-bottom: 0cm;">保留两位小数</p> </p>
我写的正则:
import re a = '图片:<font color="#000000"><img width="147" height="52" src="http://127.0.0.1:80/JudgeOnline/admin/../upload/pimg1054_1.png" alt="" /></font></p> <img width="147" height="52" src="http://127.0.0.1:80/JudgeOnline/admin/../upload/asffas_ad.png" alt="" /><p style="margin-bottom: 0cm;">保留两位小数</p> </p>'#re_img = re.compile('<\s*img.*src=[\"\']?.*?(\/\.[jpngif]+)[\"\']?.*\/>')re_img = re.compile('''<\s*img.*src=["']?[\S]+\/([^\/]+\.[jpngif]+)["']?.*?>''') s = re_img.sub(r'\1', a) print(s)
貌似匹配了第一图片标签的<img和最后一个图片标签的/>,结果只保留了一个图片。
请问该怎么替换?
面对疾风吧2016-11-09 16:54:59
import re reg='' content='图片: 保留两位小数
' m=re.search(reg,content) imgName=m.group(1).split('/')[-1] res=re.sub(reg,imgName.strip(),content) print(res)