ホームページ >バックエンド開発 >C++ >ペルシア語文字のみを検証する正規表現を作成するにはどうすればよいですか?

ペルシア語文字のみを検証する正規表現を作成するにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2025-01-02 17:03:39174ブラウズ

How to Create a Regex to Validate Only Persian Characters?

ペルシア語文字のみを受け入れるための正規表現

入力にペルシア語文字のみが含まれていることを検証するのは、場合によっては困難な場合があります。一連のコードポイントは適切な解決策のように見えますが、意図せずに不要な文字が含まれる可能性があります。

アラビア語 (0600 ~ 06FF) およびペルシア語 (PE) (0622 ~ 062F、0631 ~ 064A) の Unicode 文字セット ブロック、064C~065F、0670~067F、 0680 ~ 0683、0685 ~ 0687、0691 ~ 069A、069C ~ 069E)は若干異なります。一般的に推奨される正規表現 [u0600-u06FF] は、数字やペルシア語で使用されない一部の文字を含むすべてのアラビア文字をカバーします。

解決策

ペルシア語文字のみを正確に検出するには、次の文字を考えてみましょうセット:

  • 文字: ^[آابپتثجچحخدذرزژسشصضطظعغفقکگلمنوهی] $
  • 数字: ^[۰۱۲۳۴۵۶۷۸۹] $
  • 母音: [ ٌ ًّ َ ِ ُ ْ ]

特定の要件に合わせて、必要に応じてこれらのセットを組み合わせます。さらに、アラビア語のハムザ (ء) を文字セットに含めることもできます。

回避

[u0600-u06FF] または [آ-ی] の使用を避けてください。これらには、それぞれペルシア語で使用されていない文字または余分な文字が含まれているためです。

以上がペルシア語文字のみを検証する正規表現を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。