Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan kad bebas untuk memadankan rentetan dalam Python
Gunakan kaedah fnmatch.filter()
untuk mendapatkan rentetan yang sepadan dengan corak daripada senarai.
Gunakan kaedah fnmatch.fnmatch()
untuk menyemak sama ada rentetan sepadan dengan corak.
import fnmatch a_list = ['fql.txt', 'jiyik.txt', 'com.csv'] pattern = '*.txt' filtered_list = fnmatch.filter(a_list, pattern) print(filtered_list) # ????️ ['fql.txt', 'jiyik.txt']
Jika kami lebih suka menggunakan ungkapan biasa, sila tatal ke bawah ke sari kata seterusnya. Kaedah
fnmatch.filter
menerima iterable dan corak serta mengembalikan senarai baharu yang mengandungi hanya unsur iterable yang sepadan dengan corak yang disediakan.
Corak dalam contoh bermula dengan mana-mana satu atau lebih aksara dan berakhir dengan .txt
.
Corak dalam contoh mengandungi hanya satu kad bebas, tetapi anda boleh menggunakan seberapa banyak kad bebas yang anda mahu.
Perhatikan bahawa asterisk
*
sepadan dengan semua (satu atau lebih aksara).
Jika anda ingin memadankan mana-mana aksara tunggal, gantikan asterisk *
dengan tanda soal ?
.
*
sepadan dengan semua (satu atau lebih aksara)
?
sepadan dengan mana-mana aksara tunggal
[sequence]
sepadan dengan mana-mana aksara dalam jujukan
[!sequence]
padan mana-mana aksara daripada jujukan
di bawah ialah contoh menggunakan tanda soal untuk memadankan mana-mana aksara tunggal.
import fnmatch a_list = ['abc', 'abz', 'abxyz'] pattern = 'ab?' filtered_list = fnmatch.filter(a_list, pattern) print(filtered_list) # ????️ ['abc', 'abz']
Corak ini sepadan dengan rentetan bermula dengan ab diikuti oleh mana-mana aksara tunggal.
Jika anda ingin menggunakan kad bebas untuk menyemak sama ada rentetan sepadan dengan corak, gunakan kaedah fnmatch.fnmatch()
.
import fnmatch a_string = '2023_jiyik.txt' pattern = '2023*.txt' matches_pattern = fnmatch.fnmatch(a_string, pattern) print(matches_pattern) # ????️ True if matches_pattern: # ????️ this runs print('The string matches the pattern') else: print('The string does NOT match the pattern')
Corak bermula dengan 2023, diikuti dengan mana-mana satu atau lebih aksara dan berakhir dengan .txt. Kaedah
fnmatch.fnmatch
menerima rentetan dan corak sebagai parameter. Kaedah mengembalikan Benar jika rentetan sepadan dengan corak, jika tidak, ia mengembalikan Salah. Hanya gantikan asterisk*
dengan tanda soal?
jika anda ingin memadankan mana-mana aksara tunggal dan bukannya mana-mana satu atau lebih aksara.
Sebagai alternatif, kita boleh menggunakan ungkapan biasa.
Gunakan kad bebas untuk memadankan rentetan:
Gunakan kaedah re.match()
untuk menyemak sama ada rentetan sepadan corak tertentu yang diberikan. Gunakan .*
aksara dan bukannya aksara kad bebas. Kaedah
import re a_list = ['2023_fql.txt', '2023_jiyik.txt', '2023_com.csv'] regex = re.compile(r'2023_.*\.txt') list_of_matches = [ item for item in a_list if re.match(regex, item) ] print(list_of_matches) # ????️ ['2023_fql.txt', '2023_jiyik.txt']
re.compile
menyusun corak ungkapan biasa ke dalam objek yang boleh digunakan untuk pemadanan menggunakan kaedah match()
atau search()
nya.
Ini lebih cekap daripada menggunakan re.match
atau re.search
secara langsung kerana ia menyimpan dan menggunakan semula objek ungkapan biasa.
Ungkapan biasa bermula dengan 2023_.
Aksara
.*
dalam ungkapan biasa digunakan sebagai aksara kad bebas untuk memadankan mana-mana satu atau lebih aksara.
Titik .
sepadan dengan mana-mana aksara kecuali baris baharu.
Asterisk *
sepadan dengan ungkapan biasa sebelumnya (titik .
) sifar atau lebih kali.
Kami menggunakan aksara sengkang ke belakang untuk melarikan diri dari titik. dalam sambungan, kerana seperti yang kita lihat sebelum ini, titik
.
mempunyai makna istimewa apabila digunakan dalam ungkapan biasa. Dalam erti kata lain, kami menggunakan garis miring ke belakang untuk mengendalikan titik. sebagai watak literal.
Kami menggunakan pemahaman senarai untuk mengulangi senarai rentetan.
Kefahaman senarai digunakan untuk melaksanakan operasi tertentu pada setiap elemen atau untuk memilih subset elemen yang memenuhi syarat.
Dalam setiap lelaran, kami menggunakan kaedah re.match()
untuk menyemak sama ada rentetan semasa sepadan dengan corak.
import re a_list = ['2023_fql.txt', '2023_jiyik.txt', '2023_com.csv'] regex = re.compile(r'2023_.*\.txt') list_of_matches = [ item for item in a_list if re.match(regex, item) ] print(list_of_matches) # ????️ ['2023_fql.txt', '2023_jiyik.txt']
Kaedah re.match
mengembalikan objek padanan jika ungkapan biasa yang disediakan sepadan dalam rentetan.
Jika rentetan tidak sepadan dengan corak ungkapan biasa, kaedah
match()
mengembalikan Tiada.
Senarai baharu mengandungi hanya rentetan dalam senarai asal yang sepadan dengan corak.
Jika anda hanya mahu memadankan mana-mana aksara tunggal, alih keluar asterisk selepas titik *.
dalam regex.
import re a_list = ['2023_a.txt', '2023_bcde.txt', '2023_z.txt'] regex = re.compile(r'2023_.\.txt') list_of_matches = [ item for item in a_list if re.match(regex, item) ] print(list_of_matches) # ????️ ['2023_a.txt', '2023_z.txt']
Dot .
sepadan dengan mana-mana watak kecuali baris baharu.
Dengan menggunakan titik
.
tanpa melarikan diri, regex memadankan apa-apa sahaja bermula dengan 2023_ diikuti dengan mana-mana aksara tunggal yang berakhir dengan .txt Rentetan pada tamat.
Jika anda memerlukan bantuan membaca atau menulis ungkapan biasa, sila rujuk tutorial ungkapan biasa kami.
Halaman ini mengandungi senarai semua aksara khas dan banyak contoh berguna.
Jika anda ingin menggunakan ungkapan biasa untuk menyemak sama ada rentetan sepadan dengan corak, kita boleh menggunakan kaedah re.match()
secara langsung.
import re a_string = '2023_fql.txt' matches_pattern = bool(re.match(r'2023_.*\.txt', a_string)) print(matches_pattern) # ????️ True if matches_pattern: # ????️ this runs print('The string matches the pattern') else: print('The string does NOT match the pattern')
如果字符串与模式匹配,则
re.match()
方法将返回一个匹配对象,如果不匹配,则返回 None 。
我们使用 bool()
类将结果转换为布尔值。
如果要对单个字符使用通配符,请删除星号 *
。
import re a_string = '2023_ABC.txt' matches_pattern = bool(re.match(r'2023_.\.txt', a_string)) print(matches_pattern) # ????️ False if matches_pattern: print('The string matches the pattern') else: # ????️ this runs print('The string does NOT match the pattern')
请注意
,点.
我们没有使用反斜杠作为前缀用于匹配任何单个字符,而点.
我们以反斜杠 \ 为前缀的被视为文字点。
示例中的字符串与模式不匹配,因此 matches_pattern
变量存储一个 False 值。
Atas ialah kandungan terperinci Cara menggunakan kad bebas untuk memadankan rentetan dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!