Heim >Backend-Entwicklung >Python-Tutorial >Wie erfasst man mehrzeilige Textblöcke mit regulären Ausdrücken in Python?
Regulärer Ausdruck zum Abgleichen mehrzeiliger Textblöcke
In Python kann das Abgleichen von Text über mehrere Zeilen hinweg eine Herausforderung sein. Dieser Artikel bietet eine prägnante Lösung zum Erfassen von mehrzeiligen Blöcken und den zugehörigen Liniengruppen.
Bedenken Sie das folgende Textformat:
some Varying TEXT DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF [more of the above, ending with a newline] [yep, there is a variable number of lines here] (repeat the above a few hundred times).
Das Ziel besteht darin, zwei Gruppen zu erfassen: den „einigen variierenden TEXT“. "-Zeile und die nachfolgenden Großbuchstaben (ohne Zeilenumbrüche) in einer Capture-Gruppe.
Lösungsansatz
re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)
Erläuterung
Beispiel
text = "some Varying TEXT\nDSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF\n[more of the above]\n[yep, there is a newline]\n(repeat the above)." match = re.match(r"^(.+)\n((?:\n.+)+)", text, re.MULTILINE) print(match.group(1)) # "some Varying Text" print(match.group(2)) # "DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF\n[more of the above]\n[yep, there is a newline]"
Dieser Ansatz nutzt das Re-Modul von Python und seine MULTILINE-Option, um mehrzeiliges Matching zu ermöglichen und Verankerungsprobleme zu vermeiden.
Das obige ist der detaillierte Inhalt vonWie erfasst man mehrzeilige Textblöcke mit regulären Ausdrücken in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!