Maison > Article > développement back-end > Comment implémenter une correspondance superposée avec des expressions régulières Python
Cet article vous apporte des connaissances pertinentes sur Python. Il présente principalement comment les expressions régulières Python implémentent la correspondance qui se chevauche. Examinons-le ensemble, j'espère qu'il sera utile à tout le monde.
【Recommandation associée : Tutoriel vidéo Python3】
import regex string = '100101010001' str_re = '101' print(regex.findall(str_re, string, overlapped=True))
La correspondance de bibliothèques ordinaires ne peut correspondre qu'à un seul '101'.
Les expressions régulières peuvent être comprises comme des expressions permettant de filtrer des données, qui sont composées d'un nombre limité d'atomes et de métacaractères.
Atomes : Unité de base, chaque expression a au moins un atome
Les caractères ordinaires constituent les atomes | |
---|---|
Les caractères non imprimables constituent les atomes (caractères qui ne sont pas imprimés sur le station de sortie) |
n Nombre D : L'opposé de ds : Correspond à tous les caractères d'espacement, tels que les espaces, les nouvelles lignes, les retraits |
Les tables atomiques constituent les atomes Un groupe d'atomes constitue un tableau, déclaré par []Les priorités des atomes dans le tableau sont égales, mais le contenu n'apparaît que dans l'ordreSi le tableau des atomes commence par ^, cela signifie négation | |
ont des significations particulières dans les expressions régulières. Les caractères |
. correspondent à n'importe quel caractère, à l'exception du caractère de nouvelle ligne |
correspond à la position de départ de la chaîne
* | |
? | |
+ | |
{ j } | |
{ j , } | |
{ j , k } | |
i | j | |
( ) | |
est dans la fonction Le paramètre à la position du drapeau change de signification sans changer l'expression régulière et ajuste le résultat correspondant. | |
re.I | Ignorer la casse lors de la correspondance |
re.MCorrespondance multiligne
re.U | |
re.S | |
Correspondance régulière | |
Fonctions couramment utilisées pour la correspondance régulière : (appelez le module d'expression régulière re) |
re.search(pat, str[, flag])
: scannez la chaîne str et renvoie la position de pat (La première correspondance réussie), flag est utilisé pour contrôler la méthode de correspondance des expressions régulièresimport re
str = 'python'
pat = 'pytho[a-n]'
print(re.search(pat, str))
re.match(pat, str[, flag])
: scannez le début du string str Position, renvoie la position de pat (la première correspondance réussie), le flag est utilisé pour contrôler la méthode de correspondance des expressions régulières [S'il ne correspond pas au début, il se terminera et n'en renverra aucun]
import re str_1 = 'hello world' str_2 = 'world hello' pat = 'world' print(re.match(pat, str_1)) print(re.match(pat, str_2))
re.complie(pat [, flag]) : Compilez l'expression régulière pat et renvoyez l'objet d'expression régulière
findall(str[, pos[, endpos]])
: Faire correspondre tout et renvoyer la chaîne sous forme de liste Pour toutes les sous-chaînes correspondantes [pas seulement la première fois], pos et endpos peuvent spécifier la position de départ dans la chaînere.complie(pat).findall(str)
: fonction de correspondance globale, fait correspondre toutes les sous-chaînes de str qui correspondent à pat, charge une liste et renvoie le résultat
import re str = "hello world hello world hello world" pat = "hello" print(re.complie(pat).findall(str)) print(re.complie(pat).findall(str, 5, 15))
re.search(pat, str[, flag])
:扫描字符串str,返回pat的位置(第一次成功匹配的),flag用于控制正则表达式的匹配方式import re str = "400-823-823" pat = "-" #短横改空格,最大替换次数2 str_new = re.sub(pat, " ", str, count=2)
re.match(pat, str[, flag])
:扫描字符串str开始的位置,返回pat的位置(第一次成功匹配的),flag用于控制正则表达式的匹配方式【若开始就不符合则结束,返回none】re.complie(pat[, flag])
:编译正则表达式pat,返回正则表达式对象findall(str[, pos[, endpos]])
:匹配所有,用列表返回string中所有匹配到的子串【不止第一次】,pos和endpos可指定在string中的起始位置re.complie(pat).findall(str)
:全局匹配函数,匹配str中所有符合pat的子串,装入一个列表返回结果re.sub(pat, repl, str[, count[, flag]])
re.sub(pat, repl, str[, count[, flag]]) code> : Remplacer les caractères Correspondances dans la chaîne [données propres], vous pouvez utiliser count pour spécifier le nombre maximum de remplacements
[Recommandations associées : Tutoriel vidéo Python3]
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!