首页  >  文章  >  后端开发  >  javascript - PHP正则 去除uncode 控制字符的正则

javascript - PHP正则 去除uncode 控制字符的正则

WBOY
WBOY原创
2016-10-10 11:55:541224浏览

在写网站的用户名验证,叫玩渗透的朋友测试。。然后给我来了个控制字符的输入(虽然没啥关系,但是,还是有影响。貌似在sf上面的正则也不起作用。还有,PHP perl怎么使用uncode?
如下测试:

<code class="php"><?php $str=json_decode('"ux\u202eDD"');
    var_dump($str);
    var_dump(preg_match('/\x202e/', $str));</code></code>

无法匹配(注:u202e 为RLO控制字符)
违禁字符 测试:‮功轮法
字符序为 RLO功轮法
貌似控制字符钻的空子蛮多?
贴吧已经屏蔽了控制字符,不过,我能力有限,没有找到相关的控制JS的REX。
特来sf求助。
PS:用户名中文没法用 /^[x4e00-x9affw]{4,12}$/

回复内容:

在写网站的用户名验证,叫玩渗透的朋友测试。。然后给我来了个控制字符的输入(虽然没啥关系,但是,还是有影响。貌似在sf上面的正则也不起作用。还有,PHP perl怎么使用uncode?
如下测试:

<code class="php"><?php $str=json_decode('"ux\u202eDD"');
    var_dump($str);
    var_dump(preg_match('/\x202e/', $str));</code></code>

无法匹配(注:u202e 为RLO控制字符)
违禁字符 测试:‮功轮法
字符序为 RLO功轮法
貌似控制字符钻的空子蛮多?
贴吧已经屏蔽了控制字符,不过,我能力有限,没有找到相关的控制JS的REX。
特来sf求助。
PS:用户名中文没法用 /^[x4e00-x9affw]{4,12}$/

翻完了PHP Manual ,找到了匹配的模式,,,中文,a-zA-Z_,匹配正则:
/[wx{4e00}-x{9aff}]{4,12}/u 测试:

<code class="php"><?php $str=json_decode('"ux这\u202eわかぃまぃだDD"');
    var_dump($str);
    var_dump(preg_match('/^[\w\x{4e00}-\x{9aff}]{4,12}$/u', $str,$match));
    var_dump($match);</code></code>

中文和日语应该都没问题了,要开启utf-8模式。

在UTF-8模式, “x{…}”允许使用, 花括号内的内容是十六进制有效数字。 它将给出的十六进制数字解释为 UTF-8 字符代码。

u (PCRE_UTF8)
此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。
问题结束,不明白为啥没大大回答。

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn