Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Mengekstrak Padanan Terpendek daripada Rentetan Bersarang dengan Ungkapan Biasa?

Bagaimana untuk Mengekstrak Padanan Terpendek daripada Rentetan Bersarang dengan Ungkapan Biasa?

Linda Hamilton
Linda Hamiltonasal
2024-10-24 05:17:30269semak imbas

How to Extract Shortest Matches from Nested Strings with Regular Expressions?

Mengekstrak Padanan Terpendek daripada Rentetan Bersarang

Apabila berurusan dengan fail log yang besar, adalah penting untuk mengekstrak maklumat khusus dengan cekap. Dalam kes ini, tugasnya adalah untuk mengenal pasti dan mengekstrak rentetan berbilang baris antara dua rentetan sempadan tertentu: "mula" dan "tamat."

Untuk menangani cabaran ini, ungkapan biasa (regex) muncul sebagai alat yang berkuasa . Walaupun pendekatan regex mudah mungkin menangkap padanan yang tidak diingini, penyelesaian yang lebih halus diperlukan untuk mengasingkan padanan yang dimaksudkan.

Reex yang disediakan, (mula((?!mula).)*?tamat), mengekstrak dengan teliti yang diingini sepadan dengan menggunakan pernyataan pandangan negatif. Penegasan ini memastikan bahawa regex tidak mendahului mana-mana padanan yang bermula dengan "mula" dalam teks yang telah dipadankan, menghalang tangkapan palsu.

Untuk mendapatkan semula semua kejadian dalam rentetan berbilang baris, findall() kaedah boleh dimanfaatkan bersama-sama dengan pengubah suai re.S (baris tunggal). Gabungan ini membolehkan regex untuk merawat keseluruhan rentetan sebagai satu baris, menghapuskan keperluan untuk mengendalikan sempadan baris secara manual.

Dalam konteks contoh yang diberikan, regex berjaya mengenal pasti padanan yang diingini:

start wait for it...
    profit!
here end
start second match
win. end

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Padanan Terpendek daripada Rentetan Bersarang dengan Ungkapan Biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn