僅接受波斯字的正規表示式
線上表單驗證中,通常需要將使用者輸入限制為特定字元集。在處理波斯文本時,一個常見的挑戰是確保只接受波斯語字符,排除所有其他字符。
常見的錯誤方法
驗證波斯語的一些嘗試使用正則表達式的字元依賴於代碼點範圍 u0600-u06FF。然而,該範圍也包含阿拉伯字符,從而導致誤報。同樣,僅依靠字元範圍 [Î-Ì] 也無法解釋所有波斯字元。
正確解
用於驗證的正確字元集波斯語字元包括以下:
-
字母: [????????????????????????????????????????????????? ???????????????????? ?????????????????????????????????????????????????? ????????????????????? ?????????????????????????????????????????????????? ???????????????????? ??????????????????????????????????????????=???????? ????????????????????? ?????????????????????????????????????????????????? ???????????????????? ?????????????????????????????????????????????????? ????????????????????? ?????????????????????????????????????????????????? ???????????????????? ?????????????????????????????????????????????????? ???????????...數字):
[01234567789]-
母音:
[ ٌ ًّ َ ِ ُ ْ ]-
或者,您可以將以下代碼點範圍用於正規表示式支援碼符號:
字母:
[u0622u0627u0628u067Eu062A-u062Cu0686u062D-u0632u0698u0633-u 063Au0641u0642u06A9u06AFu0644-u0648u06CC]-
數字:
[u06F0-u06F9]-
元音:
[u202Cu064Bu064Cu064E-u0652]-
為什麼要避免u0600-u06FF 和[Ô-Ì]?
儘管包含所需的波斯語字符,但u0600-u06FF 和[Î-Ì] 都不準確且效率低。 u0600-u06FF 包含許多不相關的字符,例如阿拉伯擴展字母、變音符號和標點符號。 [Т-2] 也包含超出必要波斯語字母表的字符。
透過使用正確的字符集,您可以確保表單欄位中只允許使用授權的波斯語字符,從而提高資料的準確性和一致性。
以上是如何建立正規表示式以僅驗證線上表單中的波斯語字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!