Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich ganze Wörter in einer Zeichenfolge mithilfe regulärer Ausdrücke effizient zuordnen?
Problem:
Das Abgleichen ganzer Wörter in einer Zeichenfolge mithilfe regulärer Ausdrücke kann kompliziert sein wenn Wörter durch Leerzeichen getrennt sind und Satzzeichen haben. Diese Frage untersucht eine Möglichkeit, den Prozess der Zuordnung ganzer Wörter zu vereinfachen, ohne dass mehrere Übereinstimmungsmuster erforderlich sind.
Wortgrenzen verstehen:
Der Schlüssel zur Zuordnung ganzer Wörter liegt in der Verwendung „Wortgrenzen“ (b). Dieses Sonderzeichen weist die Regex-Engine an, Wörter zu finden, bei denen es sich bei den umgebenden Zeichen um Nicht-Wort-Zeichen handelt. Somit findet b...|b jedes Wort, das durch Nicht-Wort-Zeichen begrenzt ist.
Implementierung mit Einzelausdruck:
<br>match_string = r'b' Wort r'b'<br>
Durch die Verwendung dieses Musters und das Escapen von Sonderzeichen können Sie ganz einfach ganze Wörter zuordnen, auch solche mit umgebender Interpunktion.
Mehrere ganze Wörter abgleichen:
Wenn mehrere Wörter als ganze Wörter abgeglichen werden müssen, können Sie mithilfe der Wortgrenze und des Pipe-Operators (|) ein Regex-Muster erstellen:
<br>match_string = r'b(?:{word1})|b(?:{word2})|b(?:{word3})b' # Beispielmuster für den Abgleich von „word1“ , „Wort2“ und „Wort3“<br>
Dieses Muster stellt sicher, dass nur die angegebenen Wörter als ganze Wörter übereinstimmen, auch innerhalb der Zeichenfolge.
Wortmehrdeutigkeit und eindeutige Wortgrenzen:
In Fällen, in denen die abzugleichenden Wörter Sonderzeichen enthalten oder mit Nicht-Wort-Zeichen beginnen/enden können, können Sie eindeutige Wortgrenzen oder Leerraumgrenzen verwenden.
Vorteile der Verwendung von Wortgrenzen:
Beispielcode:
<br>import re</p> <p>string = "Wort hierWort Wort, there word"<br>words = ["word", "hereword", "there"]<br>match_pattern = r'b(?:{})b'.format('|'.join(words))</p> <p>matches = re.findall(match_pattern, string)<br>print(matches) # Ausgabe: ['word', 'hereword', 'word']<br>
Indem Sie Wortgrenzen in Ihre Regex-Muster integrieren, können Sie ganze Wörter in einer Zeichenfolge effizient und genau zuordnen, selbst wenn sie von Satzzeichen oder Sonderzeichen umgeben sind.
Das obige ist der detaillierte Inhalt vonWie kann ich ganze Wörter in einer Zeichenfolge mithilfe regulärer Ausdrücke effizient zuordnen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!