Heim >Backend-Entwicklung >Python-Tutorial >Detaillierte Erläuterung der Verwendung des Python-Re-Moduls

Detaillierte Erläuterung der Verwendung des Python-Re-Moduls

Patricia Arquette
Patricia ArquetteOriginal
2023-09-05 09:34:121569Durchsuche

Das re-Modul von Python ist eines der Kernmodule für reguläre Ausdrucksoperationen. Häufig verwendete Methoden sind: 1. re.match, versuchen Sie, das Muster ab der Startposition der Zeichenfolge abzugleichen. 2. re.search, suchen Sie nach dem Muster in der Zeichenfolge. 3. re.findall, geben Sie den gesamten Inhalt in der Zeichenfolge zurück das entspricht der Musterliste; 4. re.finditer, gibt einen Iterator aller Inhalte zurück, die dem Muster in der Zeichenfolge entsprechen. 5. re.split, teilt die Zeichenfolge gemäß den passenden Aufteilungsregeln usw. auf.

Detaillierte Erläuterung der Verwendung des Python-Re-Moduls

Das re-Modul von Python enthält die folgenden häufig verwendeten Methoden:

re.match(pattern, string): Versuchen Sie, das Muster von der Startposition der Zeichenfolge aus abzugleichen. Wenn die Startposition nicht erfolgreich übereinstimmt, keine wird zurückgegeben.

re.search(pattern, string): Nach Muster in der Zeichenfolge suchen. Wenn die Übereinstimmung erfolgreich ist, wird das erste übereinstimmende Objekt zurückgegeben, andernfalls wird None zurückgegeben.

re.findall(pattern, string): Gibt eine Liste aller Inhalte in der Zeichenfolge zurück, die dem Muster entsprechen.

re.finditer(Muster, Zeichenfolge): Gibt einen Iterator aller Inhalte in der Zeichenfolge zurück, die dem Muster entsprechen.

re.sub(pattern, repl, string, count=0): Ersetzen Sie das gesamte oder einen Teil des String-Matching-Musters durch repl. Der Count-Parameter wird verwendet, um die Anzahl der Ersetzungen anzugeben.

re.split(pattern, string, maxsplit=0, flags=0): Teilen Sie die Zeichenfolge gemäß den passenden Aufteilungsregeln in mehrere Teile auf und geben Sie eine Liste zurück.

re.escape(string): Fügen Sie das Escape-Zeichen „“ vor Sonderzeichen in der Zeichenfolge hinzu, um sie in normale Zeichen umzuwandeln.

re.purge(): Leeren Sie den Kompilierungscache für reguläre Ausdrücke, um unnötige Kompilierung zu vermeiden.

re.escape(string): Fügen Sie das Escape-Zeichen „“ vor Sonderzeichen in der Zeichenfolge hinzu, um sie in normale Zeichen umzuwandeln.

Diese Methoden bieten eine Vielzahl verschiedener regulärer Ausdrucksoperationen, einschließlich Mustervergleich, Suchen, Ersetzen, Teilen usw. Sie können die geeignete Methode auswählen, um entsprechend den spezifischen Anforderungen zu arbeiten.

Das re-Modul von Python ist eines der Kernmodule für reguläre Ausdrucksoperationen. Reguläre Ausdrücke sind ein leistungsstarkes Werkzeug zum Zuordnen, Suchen und Ersetzen von Text. Reguläre Ausdrücke verwenden eine spezielle Syntax, um Muster auszudrücken. Hier sind einige gängige Syntax für reguläre Ausdrücke:

: Entspricht jedem Zeichen (außer Zeilenumbruch).

^ : Entspricht dem Anfang der Zeichenfolge.

$: Entspricht dem Ende der Zeichenfolge.

[...]: Stellt eine Reihe von Zeichen dar, aus denen ein Zeichen ausgewählt werden kann. Beispielsweise entspricht [A-Za-z] einem der Buchstaben A bis Z oder a bis z.

[^...]: Zeigt Zeichen an, die nicht im Satz enthalten sind. Beispielsweise entspricht [^A-Za-z] jedem Zeichen außer den Buchstaben A bis Z oder a bis z.

[a-z]: Entspricht allen Kleinbuchstaben.

[A-Z]: Entspricht allen Großbuchstaben.

[0-9]: Entspricht einer beliebigen Zahl.

d: Entspricht einer beliebigen Dezimalziffer, äquivalent zu [0-9].

D: Entspricht jedem nicht numerischen Zeichen, äquivalent zu [^0-9].

s: Entspricht jedem Leerzeichen, äquivalent zu [tnrf].

S: Entspricht jedem Zeichen, das kein Leerzeichen ist.

w: Entspricht jedem alphanumerischen Zeichen, äquivalent zu [a-zA-Z0-9_].

W: Entspricht jedem nicht-alphanumerischen Zeichen.

b: Entspricht jeder Wortgrenze (zwischen einem Wort und einem Leerraum). Beispielsweise stimmt „wb“ nicht mit dem „w“ in „works“ überein, sondern mit dem vorhergehenden „w“ in „world“. „WVb“ stimmt auch nicht mit „WV“ in „WVREPUBLIC“ überein, wohl aber mit „WV“ in „WEST VIRGINIA“. Beachten Sie, dass dies nichts damit zu tun hat, ob das folgende Zeichen ein Buchstabe oder eine Zahl ist.

B: Entspricht jeder Nicht-Wort-Grenze (zwischen einem Wort und einem Nicht-Leerzeichen). Beispielsweise stimmt „wB“ mit dem „w“ in „world“ überein, nicht jedoch mit dem „w“ in „what“. „WVB“ stimmt auch nicht mit „WV“ in „WVREPUBLIC“ überein, wohl aber mit „WV“ in „WEST VIRGINIA“. Beachten Sie, dass dies nichts damit zu tun hat, ob das vorherige Zeichen ein Buchstabe oder eine Zahl ist.

|. : Zeigt eine Auswahl an, zum Beispiel entspricht a|b|c „a“, „b“ oder „

“.

Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung der Verwendung des Python-Re-Moduls. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn