Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimanakah kita mencari kedudukan tepat setiap perlawanan dalam ungkapan biasa Python?

Bagaimanakah kita mencari kedudukan tepat setiap perlawanan dalam ungkapan biasa Python?

王林
王林ke hadapan
2023-08-31 12:13:34642semak imbas

Bagaimanakah kita mencari kedudukan tepat setiap perlawanan dalam ungkapan biasa Python?

Pengenalan

modul semula ialah ungkapan biasa yang kami gunakan dalam Python. Ungkapan biasa digunakan untuk carian teks dan operasi teks yang lebih kompleks. Alat seperti grep dan sed, editor teks seperti vi dan emacs, dan bahasa komputer seperti Tcl, Perl dan Python semuanya mempunyai sokongan ekspresi biasa terbina dalam.

Modul semula dalam Python menyediakan fungsi untuk memadankan ungkapan biasa.

Ungkapan biasa yang mentakrifkan teks yang ingin kita cari atau ubah suai dipanggil corak. Literal teks dan aksara meta membentuk rentetan ini. Fungsi yang disusun digunakan untuk membuat skema. Adalah disyorkan untuk menggunakan rentetan mentah kerana ungkapan biasa selalunya mengandungi aksara khas. (Watak r digunakan untuk menunjukkan rentetan mentah.) Aksara ini tidak ditafsirkan sehingga digabungkan menjadi corak.

Sesuatu corak boleh digunakan pada rentetan teks menggunakan salah satu fungsi, corak digunakan selepas pemasangan selesai. Fungsi yang tersedia termasuk Match, Search, Find dan Finditer.

Sintaks yang digunakan

Fungsi ungkapan biasa yang digunakan di sini ialah: Kami menggunakan fungsi ungkapan biasa untuk mencari padanan.

re.match(): Determines if the RE matches at the beginning of the string. If zero or more characters at the beginning of the string match the regular expression pattern, the match method returns a match object.

p.finditer(): Finds all substrings where the RE matches and returns them as an iterator. An iterator delivering match objects across all non-overlapping matches for the pattern in a string is the result of the finditer method.

re.compile(): Compile a regular expression pattern into a regular expression object, which can be used for matching using its match(), search(), and other methods described below. The expression’s behavior can be modified by specifying a flag's value. Values can be any of the following variables combined using bitwise OR (the | operator).

m.start(): m.start() returns the offset in the string at the match's start.

m.group(): You may use the multiple-assignment approach to assign each value to a different variable when mo.groups() returns a tuple of values, as in the areaCode, mainNumber = mo.groups() line below.

search: It is comparable to re.match() but does not require that we just look for matches at the beginning of the text. The search() function can locate a pattern in the string at any location, but it only returns the first instance of the pattern.

Algoritma

  • Gunakan import semula untuk mengimport modul ungkapan biasa.

  • Gunakan fungsi re.compile() untuk mencipta objek ekspresi biasa. (Ingat untuk menggunakan rentetan mentah.)

  • Hantar rentetan yang anda ingin cari kepada kaedah finditer() bagi objek Regex. Ini akan mengembalikan objek Padanan.

  • Panggil kaedah kumpulan() objek Padanan untuk mengembalikan rentetan teks dipadankan yang sebenar.

  • Kita juga boleh menggunakan kaedah span() untuk mendapatkan indeks permulaan dan penamat dalam tuple.

Contoh

 #importing re functions
import re
#compiling [A-Z0-9] and storing it in a variable p
p = re.compile("[A-Z0-9]")
#looping m times in p.finditer
for m in p.finditer('A5B6C7D8'):
#printing the m.start and m.group
   print m.start(), m.group()

Output

Ini akan menghasilkan output −

0 A
1 5
2 B
3 6
4 C
5 7
6 D
7 8

Penjelasan kod

Gunakan import semula untuk mengimport modul ungkapan biasa. Gunakan fungsi re.compile() untuk mencipta objek ungkapan biasa ("[A-Z0-9]") dan berikannya kepada pembolehubah p. Gunakan gelung untuk mengulangi m dan hantar rentetan yang anda ingin cari kepada kaedah finditer() bagi objek ungkapan biasa. Ini akan mengembalikan objek Padanan. Panggil kaedah m.group() dan m.start() objek Match untuk mengembalikan rentetan yang sebenarnya sepadan dengan teks.

Contoh

# Python program to illustrate
# Matching regex objects
# with groups
import re
phoneNumRegex = re.compile(r'(\d\d\d)-(\d\d\d-\d\d\d\d)')
mo = phoneNumRegex.search('My number is 415-555-4242.')
print(mo.groups())

Output

Ini akan menghasilkan output −

('415', '555-4242')

Penjelasan kod

Gunakan import semula untuk mengimport modul ungkapan biasa. Gunakan fungsi re.compile() untuk mencipta objek ungkapan biasa (r'(ddd)-(ddd-dddd)') dan tetapkan kepada pembolehubah phoneNumRegex. Hantar rentetan untuk dicari ke kaedah carian() objek Regex dan simpannya dalam pembolehubah mo. Ini akan mengembalikan objek Padanan. Panggil kaedah mo.groups() objek Padanan untuk mengembalikan rentetan teks dipadankan sebenar.

Kesimpulan

Kaedah search(), match() dan finditer() yang disediakan oleh modul Python re membolehkan kami memadankan corak ungkapan biasa, dan jika perlawanan itu berjaya, ia akan menyediakan contoh objek Match. Gunakan kaedah start(), end(), dan span() bagi objek Padanan ini untuk mendapatkan maklumat terperinci tentang rentetan yang dipadankan.

Apabila terdapat banyak perlawanan, anda mungkin menghadapi risiko beban memori jika anda menggunakan findall() untuk memuatkan kesemuanya. Anda boleh mendapatkan objek iterator bagi semua padanan yang berpotensi dengan menggunakan kaedah finditer(), yang akan meningkatkan kecekapan.

Ini bermakna finditer() menyediakan objek boleh panggil yang, apabila dipanggil, memuatkan hasilnya ke dalam ingatan.

Atas ialah kandungan terperinci Bagaimanakah kita mencari kedudukan tepat setiap perlawanan dalam ungkapan biasa Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:tutorialspoint.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam