需要提取的内容如下:
类似微博中的自动提取URL为超链接地址。即内容提取出来添加A标签,转换成真正的超链接。网上搜索了很久,没有找到一个切实可行的解决方案。大都只是简单的提取URL(A标签和IMG标签内的地址也被提取替换了),并不能满足以上需求。正则表达式中也没发现能够实现提取时过滤掉A标签的方法。于是转换了一下思路,“曲线救国”。即,先将所有的A标签和IMG标签正则替换为某一个统一的标记,然后再提取URL地址替换为超链接,最后再将统一的标记还原替换为以前的A标签和IMG标签便解决了。
//提取替换出所有的IMG标签(统一标记<{img}>)
preg_match_all('/] >/im',$content,$imgList);
$imgList=$imgList[0];
$str=preg_replace('/] >/im','<{img}>',$str);
//提取替换标准的URL地址
$str=preg_replace('(((f|ht){1}tp://)[-a-zA-Z0-9@:%_/ .~#?&//=] )','