Heim >Backend-Entwicklung >Python-Tutorial >Wie extrahiere ich Übereinstimmungen zwischen zwei Zeichenfolgen in Protokollen mit einer Regex?

Wie extrahiere ich Übereinstimmungen zwischen zwei Zeichenfolgen in Protokollen mit einer Regex?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-10-23 22:17:02967Durchsuche

How to Extract Matches Between Two Strings in Logs with a Regex?

Regex zum Extrahieren von Übereinstimmungen zwischen zwei Zeichenfolgen

Angenommen, eine große Protokolldatei enthält mehrzeilige Zeichenfolgen, die von bestimmten Start- und Endmarkierungen umgeben sind Ziel ist es, nur die kürzesten Zeichenfolgen zu extrahieren und auszugeben. Allerdings wird die Startmarkierung an anderer Stelle in der Datei verwendet, sodass ein einfacher regulärer Ausdruck nicht ausreicht.

Um dies zu beheben, können wir den folgenden regulären Ausdruck verwenden:

(start((?!start).)*?end)

Dieser reguläre Ausdruck stimmt überein Zeichenfolgen, die:

  • mit „start“ beginnen, gefolgt von Zeichen, die nicht „start“ enthalten.
  • mit „end“ enden.

Verwendet Mit der re.findall-Methode von Python mit dem einzeiligen Modifikator (re.S) können wir alle derartigen Zeichenfolgen aus der Eingabedatei abrufen:

<code class="python">import re

text = """
start spam
start rubbish
start wait for it...
    profit!
here end
start garbage
start second match
win. end
"""

matches = re.findall('(start((?!start).)*?end)', text, re.S)
print(matches)</code>

Dies gibt das gewünschte Ergebnis aus:

['start wait for it...
    profit!
here end', 'start second match
win. end']

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Übereinstimmungen zwischen zwei Zeichenfolgen in Protokollen mit einer Regex?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn