仅接受波斯语字符的正则表达式
在线表单验证中,通常需要将用户输入限制为特定字符集。处理波斯语文本时,一个常见的挑战是确保只接受波斯语字符,排除所有其他字符。
常见的错误方法
验证波斯语的一些尝试使用正则表达式的字符依赖于代码点范围 u0600-u06FF。然而,该范围也包含阿拉伯字符,从而导致误报。同样,仅依靠字符范围 [Î-Ì] 也无法解释所有波斯字符。
正确解决方案
用于验证的正确字符集波斯语字符包括以下:
-
字母: [????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????=????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????...数字):
[01234567789]-
元音:
[ ٌ ًّ َ ِ ُ ْ ]-
或者,您可以将以下代码点范围用于正则表达式支持代码点符号:
字母:
[u0622u0627u0628u067Eu062A-u062Cu0686u062D-u0632u0698u0633-u 063Au0641u0642u06A9u06AFu0644-u0648u06CC]-
数字:
[u06F0-u06F9]-
元音:
[u202Cu064Bu064Cu064E-u0652]-
为什么要避免 u0600-u06FF 和[Ô-Ì]?
尽管包含所需的波斯语字符,但 u0600-u06FF 和 [Î-Ì] 都不准确且效率低下。 u0600-u06FF 包含许多不相关的字符,例如阿拉伯扩展字母、变音符号和标点符号。 [Т-2] 还包含超出必要波斯语字母表的字符。
通过使用正确的字符集,您可以确保表单字段中只允许使用授权的波斯语字符,从而提高数据的准确性和一致性。
以上是如何创建正则表达式以仅验证在线表单中的波斯语字符?的详细内容。更多信息请关注PHP中文网其他相关文章!