Heim > Artikel > Web-Frontend > Wie kann man mithilfe von JavaScript RegExp Wortgrenzen mit Unicode-Zeichen in finnischem Text abgleichen?
Javascript RegExp-Wortgrenzen Unicode-Zeichen
Frage:
Bei Verwendung von JavaScripts RegExp für Zeichenfolgen Bei der Suche nach finnischen Texten mit Sonderzeichen wie ä, ö und å stimmt die Wortgrenze b nicht mit dem Wortanfang überein mit diesen Charakteren. Wie kann dieses Problem gelöst werden, um eine ordnungsgemäße Übereinstimmung von Unicode-Zeichen zu ermöglichen?
Antwort:
Das b-Wortgrenzen-Metazeichen kann zu Beginn Einschränkungen bei der Übereinstimmung von Unicode-Zeichen haben eine Zeichenfolge. Um dieses Problem zu beheben:
Replace \b with (?:^|\s)
Aufschlüsselung:
Beispiel:
Der folgende Code demonstriert die Zuordnung finnischer Wörter zu Unicode-Zeichen mithilfe einer nicht erfassenden Gruppe anstelle von b:
<code class="js">var title = "this is simple string with finnish word tämä on ääkköstesti älkää ihmetelkö"; var searchterm = "äl"; if (new RegExp("(?:^|\s)" + searchterm, "gi").test(title)) { console.log("Match:", searchterm, title); } else { console.log("Nothing found:", searchterm); }</code>
Dieser Ansatz findet erfolgreich den Suchbegriff „äl“ in der Unicode-Zeichenfolge „ääkköstesti“, da er entweder den Anfang der Zeichenfolge oder Leerzeichen als Wortgrenze betrachtet.
Das obige ist der detaillierte Inhalt vonWie kann man mithilfe von JavaScript RegExp Wortgrenzen mit Unicode-Zeichen in finnischem Text abgleichen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!