Maison >développement back-end >C++ >Comment créer une expression régulière pour valider uniquement les caractères persans ?
Regex pour accepter uniquement les caractères persans
Valider l'entrée pour s'assurer qu'elle contient uniquement des caractères persans peut parfois être difficile. Même si une série de points de code peut sembler une solution appropriée, elle peut inclure par inadvertance des caractères indésirables.
Le jeu de caractères Unicode bloque l'arabe (0600-06FF) et le persan (PE) (0622-062F, 0631-064A). , 064C-065F, 0670-067F, 0680-0683, 0685-0687, 0691-069A, 069C-069E) diffèrent légèrement. L'expression régulière couramment suggérée [u0600-u06FF] couvre tous les caractères arabes, y compris les chiffres et certains qui ne sont pas utilisés en persan.
Solution
Pour détecter avec précision uniquement les caractères persans , considérez les jeux de caractères suivants :
Combinez ces ensembles selon vos besoins pour répondre à des exigences spécifiques. De plus, vous souhaiterez peut-être inclure l'arabe Hamza (ء) dans votre jeu de caractères.
Évitement
Évitez d'utiliser [u0600-u06FF] ou [آ-ی], car ils contiennent des caractères non utilisés en persan ou des caractères en excès, respectivement.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!