Heim >Backend-Entwicklung >C++ >Wie validiere ich persische Zeichen mithilfe regulärer Ausdrücke genau?
Validierung persischer Zeichen mithilfe regulärer Ausdrücke
Im Zusammenhang mit der Formularvalidierung kann es eine Herausforderung sein, sicherzustellen, dass nur persische Zeichen akzeptiert werden. Um dieses Problem anzugehen, besteht ein gängiger Ansatz darin, reguläre Ausdrücke (Regex) zu verwenden.
Der Regex ^[u0600-u06FF] $ reicht jedoch oft nicht aus, da er auch arabische Zeichen umfasst. Um persische Zeichen genau zu validieren, ist eine geänderte Regex erforderlich.
Aktualisierte Regex
Um persische Zeichen genau zu akzeptieren, sollten Sie die aktualisierte Regex berücksichtigen:
^[\u0622\u0627\u0628\u067E\u062A-\u062C\u0686\u062D-\u063A\u0641\u0642\u06A9\u06AF\u0644-\u0648\u06CC]+$
Dieser Ausdruck entspricht den folgenden Zeichenbereichen:
Alternativ kann die Regex basierend auf Ihrer Regex-Variante vereinfacht werden und alle Buchstaben auf einmal enthalten, zum Beispiel:
^[آ-ی]+$
Warum der erweiterte Regex falsch ist
Der zuvor verwendete Regex ^[u0600-u06FF] $ ist unzureichend, weil es Folgendes enthält:
Zusätzlich Überlegungen
Für eine umfassende Validierung sollten Sie erwägen, zusätzliche Zeichen wie Hamza (ء) in den Zeichensatz aufzunehmen. Berücksichtigen Sie außerdem unterschiedliche Zahlensysteme, indem Sie bei Bedarf separate reguläre Ausdrücke für Zahlen verwenden.
Das obige ist der detaillierte Inhalt vonWie validiere ich persische Zeichen mithilfe regulärer Ausdrücke genau?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!