Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan kad bebas untuk memadankan rentetan dalam Python

Cara menggunakan kad bebas untuk memadankan rentetan dalam Python

WBOY
WBOYke hadapan
2023-05-06 12:13:062110semak imbas

Padankan rentetan menggunakan kad bebas:

  • Gunakan kaedah fnmatch.filter() untuk mendapatkan rentetan yang sepadan dengan corak daripada senarai.

  • Gunakan kaedah fnmatch.fnmatch() untuk menyemak sama ada rentetan sepadan dengan corak.

import fnmatch

a_list = ['fql.txt', 'jiyik.txt', 'com.csv']

pattern = '*.txt'
filtered_list = fnmatch.filter(a_list, pattern)
print(filtered_list)  # ????️ ['fql.txt', 'jiyik.txt']

Cara menggunakan kad bebas untuk memadankan rentetan dalam Python

Jika kami lebih suka menggunakan ungkapan biasa, sila tatal ke bawah ke sari kata seterusnya. Kaedah

fnmatch.filter menerima iterable dan corak serta mengembalikan senarai baharu yang mengandungi hanya unsur iterable yang sepadan dengan corak yang disediakan.

Corak dalam contoh bermula dengan mana-mana satu atau lebih aksara dan berakhir dengan .txt.

Corak dalam contoh mengandungi hanya satu kad bebas, tetapi anda boleh menggunakan seberapa banyak kad bebas yang anda mahu.

Perhatikan bahawa asterisk * sepadan dengan semua (satu atau lebih aksara).

Jika anda ingin memadankan mana-mana aksara tunggal, gantikan asterisk * dengan tanda soal ?.

  • * sepadan dengan semua (satu atau lebih aksara)

  • ? sepadan dengan mana-mana aksara tunggal

  • [sequence] sepadan dengan mana-mana aksara dalam jujukan

  • [!sequence] padan mana-mana aksara daripada jujukan

di bawah ialah contoh menggunakan tanda soal untuk memadankan mana-mana aksara tunggal.

import fnmatch

a_list = ['abc', 'abz', 'abxyz']

pattern = 'ab?'
filtered_list = fnmatch.filter(a_list, pattern)
print(filtered_list)  # ????️ ['abc', 'abz']

Corak ini sepadan dengan rentetan bermula dengan ab diikuti oleh mana-mana aksara tunggal.

Jika anda ingin menggunakan kad bebas untuk menyemak sama ada rentetan sepadan dengan corak, gunakan kaedah fnmatch.fnmatch().

import fnmatch

a_string = '2023_jiyik.txt'
pattern = '2023*.txt'

matches_pattern = fnmatch.fnmatch(a_string, pattern)
print(matches_pattern)  # ????️ True

if matches_pattern:
    # ????️ this runs
    print('The string matches the pattern')
else:
    print('The string does NOT match the pattern')

Corak bermula dengan 2023, diikuti dengan mana-mana satu atau lebih aksara dan berakhir dengan .txt. Kaedah

fnmatch.fnmatch menerima rentetan dan corak sebagai parameter. Kaedah mengembalikan Benar jika rentetan sepadan dengan corak, jika tidak, ia mengembalikan Salah. Hanya gantikan asterisk * dengan tanda soal ? jika anda ingin memadankan mana-mana aksara tunggal dan bukannya mana-mana satu atau lebih aksara.

Sebagai alternatif, kita boleh menggunakan ungkapan biasa.

Gunakan ungkapan biasa untuk memadankan rentetan menggunakan kad bebas

Gunakan kad bebas untuk memadankan rentetan:

Gunakan kaedah re.match() untuk menyemak sama ada rentetan sepadan corak tertentu yang diberikan. Gunakan .* aksara dan bukannya aksara kad bebas. Kaedah

import re

a_list = ['2023_fql.txt', '2023_jiyik.txt', '2023_com.csv']

regex = re.compile(r'2023_.*\.txt')

list_of_matches = [
    item for item in a_list
    if re.match(regex, item)
]

print(list_of_matches)  # ????️ ['2023_fql.txt', '2023_jiyik.txt']

re.compile menyusun corak ungkapan biasa ke dalam objek yang boleh digunakan untuk pemadanan menggunakan kaedah match() atau search()nya.

Ini lebih cekap daripada menggunakan re.match atau re.search secara langsung kerana ia menyimpan dan menggunakan semula objek ungkapan biasa.

Ungkapan biasa bermula dengan 2023_.

Aksara .* dalam ungkapan biasa digunakan sebagai aksara kad bebas untuk memadankan mana-mana satu atau lebih aksara.

  • Titik . sepadan dengan mana-mana aksara kecuali baris baharu.

  • Asterisk * sepadan dengan ungkapan biasa sebelumnya (titik .) sifar atau lebih kali.

Kami menggunakan aksara sengkang ke belakang untuk melarikan diri dari titik. dalam sambungan, kerana seperti yang kita lihat sebelum ini, titik . mempunyai makna istimewa apabila digunakan dalam ungkapan biasa. Dalam erti kata lain, kami menggunakan garis miring ke belakang untuk mengendalikan titik. sebagai watak literal.

Kami menggunakan pemahaman senarai untuk mengulangi senarai rentetan.

Kefahaman senarai digunakan untuk melaksanakan operasi tertentu pada setiap elemen atau untuk memilih subset elemen yang memenuhi syarat.

Dalam setiap lelaran, kami menggunakan kaedah re.match() untuk menyemak sama ada rentetan semasa sepadan dengan corak.

import re

a_list = ['2023_fql.txt', '2023_jiyik.txt', '2023_com.csv']

regex = re.compile(r'2023_.*\.txt')

list_of_matches = [
    item for item in a_list
    if re.match(regex, item)
]

print(list_of_matches)  # ????️ ['2023_fql.txt', '2023_jiyik.txt']

Kaedah re.match mengembalikan objek padanan jika ungkapan biasa yang disediakan sepadan dalam rentetan.

Jika rentetan tidak sepadan dengan corak ungkapan biasa, kaedah match() mengembalikan Tiada.

Senarai baharu mengandungi hanya rentetan dalam senarai asal yang sepadan dengan corak.

Jika anda hanya mahu memadankan mana-mana aksara tunggal, alih keluar asterisk selepas titik *. dalam regex.

import re

a_list = ['2023_a.txt', '2023_bcde.txt', '2023_z.txt']

regex = re.compile(r'2023_.\.txt')

list_of_matches = [
    item for item in a_list
    if re.match(regex, item)
]

print(list_of_matches)  # ????️ ['2023_a.txt', '2023_z.txt']

Dot . sepadan dengan mana-mana watak kecuali baris baharu.

Dengan menggunakan titik . tanpa melarikan diri, regex memadankan apa-apa sahaja bermula dengan 2023_ diikuti dengan mana-mana aksara tunggal yang berakhir dengan .txt Rentetan pada tamat.

Jika anda memerlukan bantuan membaca atau menulis ungkapan biasa, sila rujuk tutorial ungkapan biasa kami.

Halaman ini mengandungi senarai semua aksara khas dan banyak contoh berguna.

Jika anda ingin menggunakan ungkapan biasa untuk menyemak sama ada rentetan sepadan dengan corak, kita boleh menggunakan kaedah re.match() secara langsung.

import re

a_string = '2023_fql.txt'

matches_pattern = bool(re.match(r'2023_.*\.txt', a_string))
print(matches_pattern)  # ????️ True

if matches_pattern:
    # ????️ this runs
    print('The string matches the pattern')
else:
    print('The string does NOT match the pattern')

如果字符串与模式匹配,则 re.match() 方法将返回一个匹配对象,如果不匹配,则返回 None

我们使用 bool() 类将结果转换为布尔值。

如果要对单个字符使用通配符,请删除星号 *

import re

a_string = '2023_ABC.txt'

matches_pattern = bool(re.match(r'2023_.\.txt', a_string))
print(matches_pattern)  # ????️ False

if matches_pattern:
    print('The string matches the pattern')
else:
    # ????️ this runs
    print('The string does NOT match the pattern')

请注意 ,点 . 我们没有使用反斜杠作为前缀用于匹配任何单个字符,而点 . 我们以反斜杠 \ 为前缀的被视为文字点。

示例中的字符串与模式不匹配,因此 matches_pattern 变量存储一个 False 值。

Atas ialah kandungan terperinci Cara menggunakan kad bebas untuk memadankan rentetan dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:yisu.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam