Heim >Technologie-Peripheriegeräte >IT Industrie >Verständnis von Python Regex -Funktionen mit Beispielen
Anfänger von Python reguläre Ausdrücke: effizientes Textverarbeitungstool
In diesem Artikel werden Sie in das tiefe Verständnis der regulären Python -Ausdrücke in die Python einbezogen und lernen, wie das re
-Modul verwendet wird, um Textdaten effizient zu verarbeiten. Wir werden Kernfunktionen, Anpassung von Objektmethoden und praktische Tipps abdecken, mit denen Sie einfach mit verschiedenen Szenarien zur Textverarbeitung umgehen können.
Kernpunkte:
re
-Modul, um reguläre Ausdrücke zu verarbeiten, die leistungsstark und einfach zu bedienen sind. re.search()
zum Auffinden von Mustern, re.match()
zum Extrahieren aller Übereinstimmungen, re.findall()
zum Ersetzen von Substrings und re.sub()
zum Erstellen regulärer Expressionsmuster zur Verbesserung der Effizienz. re.compile()
re.search()
) bereitgestellt wird, wird verwendet, um den passenden Text zu extrahieren und zu manipulieren. re.match()
.group()
reguläre Expressionsflags wie .start()
(ignorieren Sie den Fall), .end()
(mehrere Zeilen), .groups()
(DOT übereinstimmen alle Zeichen, einschließlich Newlines) und re.I
Dieser Artikel zeigt die praktische Anwendung von regulären Python -Ausdrücken, einschließlich der Tests für Kennwortstärke, Dateitextvorgänge und Web -Crawling, und demonstrieren die Leistung regulärer Ausdrücke als leistungsstarke String -Such- und Betriebstools. re.M
re.S
re.X
Python reguläres Expressionsmodul: Re Dadurch werden die Funktionen und Methoden im
-Modul in der aktuellen Datei verfügbar. re
<code class="language-python">import re</code>Kernfunktion des Moduls:
re
re
Sowohl
re.search(pattern, string, flags=0)
werden verwendet, um regelmäßige Expressionsmuster in Strings zu finden und übereinstimmende Objekte (falls gefunden) oder re.match(pattern, string, flags=0)
zurückzugeben (falls nicht gefunden). nur am Anfang der Zeichenfolge nach Übereinstimmungen sucht. re.search()
re.match()
None
re.search()
Die Funktion re.match()
re.compile(pattern, flags=0)
re.compile()
re.fullmatch(pattern, string, flags=0)
re.findall(pattern, string, flags=0)
re.findall()
gibt eine Liste aller Übereinstimmungen in der Zeichenfolge zurück.
re.sub(pattern, repl, string, count=0, flags=0)
re.sub()
Funktionen werden verwendet, um Substrings zu ersetzen, die Muster in Zeichenfolgen übereinstimmen.
re.subn(pattern, repl, string, count=0, flags=0)
re.subn()
entspricht re.sub()
, gibt jedoch ein Tupel zurück, das die ersetzte Zeichenfolge und die Anzahl der Ersatzteile enthält.
Übereinstimmung mit Objekten und Methoden:
Das Match -Objekt enthält Informationen zum Matching -Ergebnis und bietet einige Methoden, um auf diese Informationen zuzugreifen:
Match.group([group1, …])
Gibt die Untergruppe des Matching -Objekts zurück.
Match.groups(default=None)
Gibt ein Tupel zurück, das alle passenden Untergruppen enthält.
Match.start([group])
& Match.end([group])
Gibt die Start- und Endindizes des Matching -Objekts zurück.
Pattern.search(string[, pos[, endpos]])
Ermöglicht die Angabe der Start- und Endpositionen der Suche.
re
reguläre Expressionsflags für Module:
reguläre Expressionsflags können das Übereinstimmungsverhalten ändern:
re.I
(Fall ignorieren) Machen Sie den Match -Fall unempfindlich.
re.S
(Punkte übereinstimmen alle Zeichen, einschließlich Zeilenpausen) Machen Sie die .
Metacharacter -Übereinstimmung mit allen Zeichen, einschließlich Zeilenpausen.
re.M
(Multi-Line-Modus) Machen Sie das ^
und $
Metacharacter mit dem Beginn und dem Ende jeder Zeile überein.
re.X
(detaillierter Modus) Ermöglicht Kommentare in regulären Ausdrücken hinzu, um die Lesbarkeit zu verbessern.
Praktische Anwendung von regulären Ausdrücken von Python:
Folgendes sind einige praktische Anwendungsbeispiele für reguläre Ausdrücke von Python:
Verwenden Sie reguläre Ausdrücke, um die Komplexität des Kennworts zu überprüfen.
Verwenden Sie regelmäßige Ausdrücke, um Text in einer Datei zu suchen und zu ersetzen.
Verwenden Sie regelmäßige Ausdrücke, um Daten von Webseiten zu extrahieren.
Schlussfolgerung:
Pythons re
Modul bietet leistungsstarke regelmäßige Expressionsverarbeitungsfunktionen, die verschiedene Textverarbeitungsaufgaben effektiv lösen können. Behinderung in regelmäßigen Ausdrücken kann die Programmierungseffizienz erheblich verbessern.
FAQ:
Spezielle Sequenzen in den regulären Ausdrücken von Python sind entkommene Sequenzen mit speziellen Bedeutungen wie d
(Zahl), D
(nicht nummer), s
(Raum), S
(Nicht-Space)) , w
(Wortzeichen), W
(Nicht-Wort-Zeichen) usw.
Sie können die Funktion re.split()
wie re.split('W ', text)
verwenden, um eine Zeichenfolge durch Nicht-Wort-Zeichen zu teilen.
re.search()
und re.match()
? re.search()
Finden Sie Übereinstimmungen im gesamten String, während re.match()
nur Übereinstimmungen am Anfang der Zeichenfolge finden.
Sie können die Funktion re.sub()
wie re.sub('World', 'Python', text)
verwenden, um "Welt" durch "Python" zu ersetzen.
Die Funktion re.match()
und ein geeignetes reguläres Ausdrucksmuster können verwendet werden, um das Format der E -Mail -Adresse zu überprüfen. Beachten Sie, dass die perfekten E -Mail -Überprüfung reguläre Ausdrücke sehr komplex sind und eine dedizierte E -Mail -Überprüfungsbibliothek empfohlen wird.
Ich hoffe, dieser Artikel hilft Ihnen, reguläre Ausdrücke besser zu verstehen und anzuwenden. Denken Sie daran, Übung ist der Schlüssel zum Beherrschen regulärer Ausdrücke!
Das obige ist der detaillierte Inhalt vonVerständnis von Python Regex -Funktionen mit Beispielen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!