Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Memadankan Blok Teks Berbilang Baris dengan Ungkapan Biasa dalam Python?

Bagaimana untuk Memadankan Blok Teks Berbilang Baris dengan Ungkapan Biasa dalam Python?

Mary-Kate Olsen
Mary-Kate Olsenasal
2024-10-25 10:25:17560semak imbas

How to Match Multi-Line Text Blocks with Regular Expressions in Python?

Memadankan Blok Teks Berbilang Baris dengan Ungkapan Biasa dalam Python

Dalam Python, pemadanan regex boleh mencabar apabila berurusan dengan teks berbilang baris . Sebagai contoh, pertimbangkan teks berikut dengan "n" mewakili baris baharu:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]
[repeat the above a few hundred times].

Matlamatnya ialah untuk menangkap dua elemen:

  • "beberapa TEKS Berbeza-beza"
  • Semua baris teks huruf besar bermula dua baris di bawah elemen pertama, sebagai kumpulan tangkapan tunggal (pemutus baris boleh dilucutkan kemudian).

Percubaan sebelumnya menggunakan variasi ungkapan biasa berikut telah tidak berjaya:

re.compile(r"^>(\w+)$$(\[.$]+)^$", re.MULTILINE)
re.compile(r"(^[^>]\[\w\s]+)$", re.MULTILINE|re.DOTALL)

Penyelesaian:

Untuk memadankan teks berbilang baris dengan betul, gunakan ungkapan biasa berikut:

re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)

Ini corak sepadan dengan yang berikut:

  • Kumpulan 1: "sesetengah TEKS Pelbagai"
  • Kumpulan 2: Semua baris teks huruf besar bermula dua baris di bawah "beberapa TEKS Bervariasi"

Inti Utama:

  • ^ dan $ sauh sepadan dengan kedudukan sejurus selepas dan sebelum baris baharu, masing-masing.
  • Pengendali ?: menjadikan kumpulan baris baharu tidak menangkap.
  • Pengkuantiti .* menangkap satu atau lebih baris teks huruf besar.

Penyelesaian Alternatif:

Jika teks sasaran mungkin mengandungi jenis baris baharu yang lain selain suapan baris (n), gunakan versi yang lebih inklusif berikut:

re.compile(r"^(.+)(?:\n|\r\n?)((?:(?:\n|\r\n?).+)+)", re.MULTILINE)

Atas ialah kandungan terperinci Bagaimana untuk Memadankan Blok Teks Berbilang Baris dengan Ungkapan Biasa dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn