首頁  >  問答  >  主體

javascript - PHP正则 去除uncode 控制字符的正则

在写网站的用户名验证,叫玩渗透的朋友测试。。然后给我来了个控制字符的输入(虽然没啥关系,但是,还是有影响。貌似在sf上面的正则也不起作用。还有,PHP perl怎么使用uncode?
如下测试:

<?php
    $str=json_decode('"ux\u202eDD"');
    var_dump($str);
    var_dump(preg_match('/\x202e/', $str));

无法匹配(注:u202e 为RLO控制字符)
违禁字符 测试:‮功轮法
字符序为 RLO功轮法
貌似控制字符钻的空子蛮多?
贴吧已经屏蔽了控制字符,不过,我能力有限,没有找到相关的控制JS的REX。
特来sf求助。
PS:用户名中文没法用 /^[x4e00-x9affw]{4,12}$/

天蓬老师天蓬老师2719 天前284

全部回覆(1)我來回復

  • PHPz

    PHPz2017-04-11 13:12:45

    翻完了PHP Manual ,找到了匹配的模式,,,中文,a-zA-Z_,匹配正则:
    /[wx{4e00}-x{9aff}]{4,12}/u 测试:

    <?php
        $str=json_decode('"ux这\u202eわかぃまぃだDD"');
        var_dump($str);
        var_dump(preg_match('/^[\w\x{4e00}-\x{9aff}]{4,12}$/u', $str,$match));
        var_dump($match);

    中文和日语应该都没问题了,要开启utf-8模式。

    在UTF-8模式, “x{…}”允许使用, 花括号内的内容是十六进制有效数字。 它将给出的十六进制数字解释为 UTF-8 字符代码。

    u (PCRE_UTF8)
    此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。
    问题结束,不明白为啥没大大回答。

    回覆
    0
  • 取消回覆