Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengekstrak Padanan Antara Dua Rentetan dalam Log dengan Regex?

Bagaimana untuk Mengekstrak Padanan Antara Dua Rentetan dalam Log dengan Regex?

Mary-Kate Olsen
Mary-Kate Olsenasal
2024-10-23 22:17:02901semak imbas

How to Extract Matches Between Two Strings in Logs with a Regex?

Regex untuk Mengekstrak Padanan Antara Dua Rentetan

Memandangkan fail log besar yang mengandungi rentetan berbilang baris yang disertakan dengan penanda permulaan dan penamat tertentu, matlamatnya adalah untuk mengekstrak dan mencetak hanya rentetan terpendek seperti itu. Walau bagaimanapun, penanda mula digunakan di tempat lain dalam fail, jadi regex mudah tidak akan mencukupi.

Untuk menangani perkara ini, kita boleh menggunakan ungkapan biasa berikut:

(start((?!start).)*?end)

regex ini sepadan rentetan yang:

  • Mulakan dengan "mula" diikuti dengan aksara yang tidak mengandungi "mula".
  • Tamat dengan "akhir".

Menggunakan Kaedah re.findall Python dengan pengubah satu baris (re.S), kita boleh mendapatkan semula semua rentetan tersebut daripada fail input:

<code class="python">import re

text = """
start spam
start rubbish
start wait for it...
    profit!
here end
start garbage
start second match
win. end
"""

matches = re.findall('(start((?!start).)*?end)', text, re.S)
print(matches)</code>

Ini akan mengeluarkan hasil yang diingini:

['start wait for it...
    profit!
here end', 'start second match
win. end']

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Padanan Antara Dua Rentetan dalam Log dengan Regex?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn