首頁 >後端開發 >C++ >如何建立正規表示式以僅驗證線上表單中的波斯語字元?

如何建立正規表示式以僅驗證線上表單中的波斯語字元?

Linda Hamilton
Linda Hamilton原創
2025-01-01 00:39:09326瀏覽

How to Create a Regex for Validating Only Persian Characters in Online Forms?

僅接受波斯字的正規表示式

線上表單驗證中,通常需要將使用者輸入限制為特定字元集。在處理波斯文本時,一個常見的挑戰是確保只接受波斯語字符,排除所有其他字符。

常見的錯誤方法

驗證波斯語的一些嘗試使用正則表達式的字元依賴於代碼點範圍 u0600-u06FF。然而,該範圍也包含阿拉伯字符,從而導致誤報。同樣,僅依靠字元範圍 [Î-Ì] 也無法解釋所有波斯字元。

正確解

用於驗證的正確字元集波斯語字元包括以下:

  • 字母: [????????????????????????????????????????????????? ???????????????????? ?????????????????????????????????????????????????? ????????????????????? ?????????????????????????????????????????????????? ???????????????????? ??????????????????????????????????????????=???????? ????????????????????? ?????????????????????????????????????????????????? ???????????????????? ?????????????????????????????????????????????????? ????????????????????? ?????????????????????????????????????????????????? ???????????????????? ?????????????????????????????????????????????????? ???????????...數字):
  • [01234567789]
  • 母音:
  • [ ٌ ًّ َ ِ ُ ْ ]
  • 或者,您可以將以下代碼點範圍用於正規表示式支援碼符號:

字母:
    [u0622u0627u0628u067Eu062A-u062Cu0686u062D-u0632u0698u0633-u 063Au0641u0642u06A9u06AFu0644-u0648u06CC]
  • 數字:
  • [u06F0-u06F9]
  • 元音:
  • [u202Cu064Bu064Cu064E-u0652]
  • 為什麼要避免u0600-u06FF 和[Ô-Ì]?

儘管包含所需的波斯語字符,但u0600-u06FF 和[Î-Ì] 都不準確且效率低。 u0600-u06FF 包含許多不相關的字符,例如阿拉伯擴展字母、變音符號和標點符號。 [Т-2] 也包含超出必要波斯語字母表的字符。

透過使用正確的字符集,您可以確保表單欄位中只允許使用授權的波斯語字符,從而提高資料的準確性和一致性。

以上是如何建立正規表示式以僅驗證線上表單中的波斯語字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn