Heim >Web-Frontend >js-Tutorial >Wie kann man mithilfe von JavaScript RegExp Wortgrenzen mit Unicode-Zeichen in finnischem Text abgleichen?

Wie kann man mithilfe von JavaScript RegExp Wortgrenzen mit Unicode-Zeichen in finnischem Text abgleichen?

Mary-Kate OlsenOriginal: 2024-10-31 06:14:02603Durchsuche

How to Match Word Boundaries with Unicode Characters in Finnish Text Using JavaScript RegExp?

Javascript RegExp-Wortgrenzen Unicode-Zeichen

Frage:

Bei Verwendung von JavaScripts RegExp für Zeichenfolgen Bei der Suche nach finnischen Texten mit Sonderzeichen wie ä, ö und å stimmt die Wortgrenze b nicht mit dem Wortanfang überein mit diesen Charakteren. Wie kann dieses Problem gelöst werden, um eine ordnungsgemäße Übereinstimmung von Unicode-Zeichen zu ermöglichen?

Antwort:

Das b-Wortgrenzen-Metazeichen kann zu Beginn Einschränkungen bei der Übereinstimmung von Unicode-Zeichen haben eine Zeichenfolge. Um dieses Problem zu beheben:

Replace \b with (?:^|\s)

Aufschlüsselung:

(?: ... ) erstellt eine nicht erfassende Gruppe.
^ entspricht dem Anfang einer Zeichenfolge.
|s entspricht Leerzeichen.
(?:^|s) gibt effektiv an, dass entweder am Anfang der Zeichenfolge oder nach einem Leerzeichen übereinstimmt.

Beispiel:

Der folgende Code demonstriert die Zuordnung finnischer Wörter zu Unicode-Zeichen mithilfe einer nicht erfassenden Gruppe anstelle von b:

<code class="js">var title = "this is simple string with finnish word tämä on ääkköstesti älkää ihmetelkö";
var searchterm = "äl";

if (new RegExp("(?:^|\s)" + searchterm, "gi").test(title)) {
    console.log("Match:", searchterm, title);
} else {
    console.log("Nothing found:", searchterm);
}</code>

Dieser Ansatz findet erfolgreich den Suchbegriff „äl“ in der Unicode-Zeichenfolge „ääkköstesti“, da er entweder den Anfang der Zeichenfolge oder Leerzeichen als Wortgrenze betrachtet.

Das obige ist der detaillierte Inhalt vonWie kann man mithilfe von JavaScript RegExp Wortgrenzen mit Unicode-Zeichen in finnischem Text abgleichen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

JavaScript String for using regexp this issue word

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Wie reduziere ich JavaScript-Objekte auf nur Schnittstelleneigenschaften in TypeScript?Nächster Artikel：Wie reduziere ich JavaScript-Objekte auf nur Schnittstelleneigenschaften in TypeScript?

In Verbindung stehende Artikel

Mehr sehen