Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich eine Zeichenfolge mithilfe mehrerer Trennzeichen in Python in Wörter aufteilen?
Aufteilen von Zeichenfolgen in Wörter mit mehreren Wortbegrenzungstrennzeichen
Wenn Sie in Python eine Zeichenfolge mit str.split() in Wörter aufteilen, können Sie kann nur ein Trennzeichen angeben. Dies kann problematisch sein, wenn Sie sowohl Satzzeichen als auch Leerzeichen als Wortgrenzen berücksichtigen möchten.
Lösung: Verwendung von re.split()
Um dieses Problem zu beheben, sollten Sie Folgendes in Betracht ziehen Verwenden Sie stattdessen die Funktion re.split(). Mit re.split() können Sie ein Muster als Argument angeben, das mehrere Wortgrenzentrennzeichen enthalten kann.
Das Muster kann mit der folgenden Syntax erstellt werden:
\W+ # Match any sequence of non-word characters | # Or \s+ # Match any sequence of whitespace characters
Zum Teilen Um die angegebene Beispielzeichenfolge in Wörter einschließlich Satzzeichen umzuwandeln, können Sie den folgenden Code verwenden:
>>> import re >>> re.split(r"\W+|\s+", "Hey, you - what are you doing here!?") ['hey', 'you', 'what', 'are', 'you', 'doing', 'here']
Der obige reguläre Ausdruck entspricht jeder Folge von Nicht-Wort-Zeichen oder Leerzeichen. Dadurch wird die Zeichenfolge effektiv in Wörter aufgeteilt.
Diese Methode bietet eine flexible und anpassbare Möglichkeit, Zeichenfolgen anhand verschiedener Trennzeichen aufzuteilen und sicherzustellen, dass alle relevanten Wörter erfasst werden.
Das obige ist der detaillierte Inhalt vonWie kann ich eine Zeichenfolge mithilfe mehrerer Trennzeichen in Python in Wörter aufteilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!