Heim  >  Artikel  >  Backend-Entwicklung  >  Wie erfasst man mehrzeilige Textblöcke mit regulären Ausdrücken in Python?

Wie erfasst man mehrzeilige Textblöcke mit regulären Ausdrücken in Python?

Barbara Streisand
Barbara StreisandOriginal
2024-10-25 04:34:02897Durchsuche

How to Capture Multiline Text Blocks with Regular Expressions in Python?

Regulärer Ausdruck zum Abgleichen mehrzeiliger Textblöcke

In Python kann das Abgleichen von Text über mehrere Zeilen hinweg eine Herausforderung sein. Dieser Artikel bietet eine prägnante Lösung zum Erfassen von mehrzeiligen Blöcken und den zugehörigen Liniengruppen.

Bedenken Sie das folgende Textformat:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times).

Das Ziel besteht darin, zwei Gruppen zu erfassen: den „einigen variierenden TEXT“. "-Zeile und die nachfolgenden Großbuchstaben (ohne Zeilenumbrüche) in einer Capture-Gruppe.

Lösungsansatz

re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)

Erläuterung

  • ^: Entspricht dem Anfang einer neuen Zeile.
  • .: Entspricht jedem Zeichen außer einem Zeilenumbruch.
  • : Entspricht einer oder mehreren Wiederholungen.
  • n: Entspricht einem Zeilenumbruchzeichen.
  • (?:...) : Erstellt eine nicht erfassende Gruppe, die mit mehreren Vorkommen des Musters innerhalb der Zeile übereinstimmt.
  • () Erfassungsgruppen schließen die beiden Teile ein des Spiels.

Beispiel

text = "some Varying TEXT\nDSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF\n[more of the above]\n[yep, there is a newline]\n(repeat the above)."
match = re.match(r"^(.+)\n((?:\n.+)+)", text, re.MULTILINE)
print(match.group(1))  # "some Varying Text"
print(match.group(2))  # "DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF\n[more of the above]\n[yep, there is a newline]"

Dieser Ansatz nutzt das Re-Modul von Python und seine MULTILINE-Option, um mehrzeiliges Matching zu ermöglichen und Verankerungsprobleme zu vermeiden.

Das obige ist der detaillierte Inhalt vonWie erfasst man mehrzeilige Textblöcke mit regulären Ausdrücken in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn