从 PHP 字符串中剥离控制字符
问题:修改正则表达式以删除控制字符
之前有位 PHP 开发者使用下面的表达式来清除字符串中的 STX 等控制字符:
preg_replace("/[^a-zA-Z0-9 .\-_;!:?äÄöÖüÜß<>='\"]/","",$pString)
但是,结果过于严格,引发了一个问题:如何有选择地删除控制字符?
A:利用特定字符类进行控制字符识别
为了精确定位控制字符,可以使用更特定的字符类:
preg_replace('/[\x00-\x1F\x7F]/', '', $input);
此表达式匹配 ASCII 代码在 x00-x1F 和 x7F 范围内的字符,包括前 32 个字符和 x7F,其中包括回车符等字符。
保留换行符等基本字符
如果需要保留特定字符,例如换行符或回车符,则可以排除它们的转义序列:
preg_replace('/[\x00-\x09\x0B\x0C\x0E-\x1F\x7F]/', '', $input);
在此修改后的表达式中,x0A(换行符)和 x0D (回车)被排除在字符类之外。
现代语法和弃用
需要注意的是 PHP 5.3.0 及其版本中 ereg_replace 的弃用PHP 7.0.0 中的后续删除要求使用 preg_replace 而不是 ereg_replace。
最后,控制字符的字符类
为了简洁且可移植的替代方案,字符类 [:cntrl:]可以就业:
preg_replace('/[[:cntrl:]]/', '', $input);
以上是如何有效地从 PHP 字符串中删除控制字符?的详细内容。更多信息请关注PHP中文网其他相关文章!