首頁 >後端開發 >php教程 >[分享]正则表达式分析/提取XML/XHTML标签属性解决方案

[分享]正则表达式分析/提取XML/XHTML标签属性解决方案

WBOY
WBOY原創
2016-06-13 10:04:581024瀏覽

[分享]正则表达式分析/提取XML/XHTML标签属性
直接看代码吧, 有什么不足请各位大神指教..

PHP code
<!--Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/--><?php #author: selfimpr#blog: http://blog.csdn.net/lgg201#mail: [email&#160;protected]$pattern    = <<< eot/<                                                            #开始标签    (?P<tagname>(?>\w+))                                    #标签名    (?P<attr>                                                #单个属性子组        (?>\s+)                                                #前置空白        (?P<attr_name>\w+)                                    #属性名        =                                                    #赋值符号        (?P<quote>(?P<single_quote>')|(?P<double_quote>"))    #读取包裹属性值的引号        (?P<attr_value>                                        #值处理子组            (?:                                                #将值分解处理: 分解为1) 偶数个转义字符的部分; 2) 单个转义字符+引号或非当前使用引号的字符                (?P<slash>(?>(?:\\\\\\\\)*)*)                #消耗掉当前位置起偶数个转义字符                (?P<chars>                                    #非转义字符自身的处理                    \\\\(?P=quote)|(?(5)[^']|[^"])            #这里用了分支, 一边是转义字符+引号, 另一边是条件匹配的非当前引号字符                )            )*                                                #对值进行的分组进行0次或多次处理        )        (?P=quote)                                            #引号闭合    )*                                                        #属性的重复    \s*                                                        #后置空白\/?>                                                        #标签闭合处理(这里的焦点在于对属性值的处理, 所以没有对的方式进行处理)/xeot;#示例输入$content1    = 战神啊共和国'>eot;$content2    = 战神啊共和国">eot;echo $pattern . chr(10);preg_match($pattern, $content1, $matches);print_r($matches);preg_match($pattern, $content2, $matches);print_r($matches);</chars></slash></attr_value></double_quote></single_quote></quote></attr_name></attr>


------解决方案--------------------
没人甩你,我来支持一下。
------解决方案--------------------
嗯,一般lgg201上的都是干货....

待会有空测一下,非找个bug出来....
------解决方案--------------------
yeah!

$content1 =
eot;

这个没出来
------解决方案--------------------
Warning: preg_match() [function.preg-match]: Unknown modifier 't' in ....
------解决方案--------------------
占楼分割线
------解决方案--------------------
嗯,这下突破不了了....

坦白说,这正则还没看懂,有空的时候学习下~~
------解决方案--------------------
to lgg201,请教


能否简单说明,大概什么场合你需要这种匹配呢?
陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn