Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengekstrak Padanan Terpendek daripada Rentetan Bersarang dengan Ungkapan Biasa?
Mengekstrak Padanan Terpendek daripada Rentetan Bersarang
Apabila berurusan dengan fail log yang besar, adalah penting untuk mengekstrak maklumat khusus dengan cekap. Dalam kes ini, tugasnya adalah untuk mengenal pasti dan mengekstrak rentetan berbilang baris antara dua rentetan sempadan tertentu: "mula" dan "tamat."
Untuk menangani cabaran ini, ungkapan biasa (regex) muncul sebagai alat yang berkuasa . Walaupun pendekatan regex mudah mungkin menangkap padanan yang tidak diingini, penyelesaian yang lebih halus diperlukan untuk mengasingkan padanan yang dimaksudkan.
Reex yang disediakan, (mula((?!mula).)*?tamat), mengekstrak dengan teliti yang diingini sepadan dengan menggunakan pernyataan pandangan negatif. Penegasan ini memastikan bahawa regex tidak mendahului mana-mana padanan yang bermula dengan "mula" dalam teks yang telah dipadankan, menghalang tangkapan palsu.
Untuk mendapatkan semula semua kejadian dalam rentetan berbilang baris, findall() kaedah boleh dimanfaatkan bersama-sama dengan pengubah suai re.S (baris tunggal). Gabungan ini membolehkan regex untuk merawat keseluruhan rentetan sebagai satu baris, menghapuskan keperluan untuk mengendalikan sempadan baris secara manual.
Dalam konteks contoh yang diberikan, regex berjaya mengenal pasti padanan yang diingini:
start wait for it... profit! here end start second match win. end
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Padanan Terpendek daripada Rentetan Bersarang dengan Ungkapan Biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!