Maison >développement back-end >Tutoriel Python >Résumé de l'apprentissage des expressions régulières Python

Résumé de l'apprentissage des expressions régulières Python

高洛峰
高洛峰original
2017-01-12 16:28:101183parcourir

La façon d'implémenter la régularité en Python consiste à utiliser le module re (abréviation de expression régulière). Vous pouvez appeler diverses méthodes du module re pour réaliser différentes fonctions. Parlons de la façon d'implémenter l'expression régulière en Python via quelles méthodes peuvent. être appelé par le module re, et quelles sont les fonctions de ces méthodes ; il y a aussi des exemples d'expressions régulières et la signification de divers symboles spéciaux :

1. re.sub et replace :

L'orthographe complète de sub est substitut, ce qui signifie remplacer ; maintenant que vous savez qu'il s'agit de remplacer, il est facile de l'utiliser dans des exemples. En fait, remplacer signifie également remplacer, mais leur utilisation. n'est pas pareil. , utilisons un exemple pour expliquer leurs similitudes et leurs différences en détail :

>>> import re
>>> str1 = 'Hello 111 is 222'
>>> str2 = str1.replace('111','222')
>>> print(str2)
Hello 222 is 222
>>>

Ceci est un exemple simple. Si c'est la situation suivante, remplacez tous les nombres par 222, puis utilisez. replace C'est plus difficile à implémenter, mais c'est relativement simple à implémenter en utilisant la sous-méthode du module re : (S'il s'agit d'une opération plus complexe, il peut ne pas être possible d'utiliser replace.)

>>> import re
>>> str1 = 'Hello 123 is 456'
>>> str2 = re.sub('\d+','222',str1)
>>> print(str2)
Hello 222 is 222
>>>

2. re.search() et re.match() :

match : seule la correspondance avec l'expression régulière du début de la chaîne est renvoyée si la correspondance est réussie, sinon aucune. .

Recherche : essayez de faire correspondre toutes les chaînes de la chaîne avec l'expression régulière. Si toutes les chaînes ne correspondent pas correctement, renvoyez aucune, sinon renvoyez matchobject.

L'exemple suivant illustre la correspondance et les similitudes et les différences de recherche montrent également que dans les applications réelles, la recherche est encore utilisée plus souvent :

import re
str = 'helloword,i am alex'
if not re.match('word',str):
print('cannot match')
print(re.match('hello',str1).group())
print(re.search('word',str1).group())
#显示结果
cannot match
hello
word


3. re.split :


En Python, si vous souhaitez diviser une chaîne, il vous suffit d'appeler la méthode split de str. Cependant, cette division ne peut être divisée qu'en fonction d'un certain caractère. spécifiez-le en même temps. Si plusieurs caractères sont utilisés pour la segmentation, cela ne peut pas être réalisé.


Heureusement, le module re fournit également la méthode split pour diviser les chaînes, et cette méthode est plus puissante et peut être divisée en fonction de plusieurs caractères en même temps. Jetons un coup d'œil à str séparément. Quelle est la différence entre split et re split :

str1 = 'helloword,i;am\nalex'
str2 = str1.split(',')
print(str2)
import re
str3 = re.split('[,|;|\n]',str1)
print(str3)
#下面是不同的输出结果
['helloword', 'i;am\nalex']
['helloword', 'i', 'am', 'alex']


De là, nous pouvons voir l'authenticité de ce qui précède.


4. findall :


La méthode findall apparaît essentiellement en même temps que la méthode de compilation. Leur utilisation est :


D'abord. Convertissez la forme chaîne d'une expression régulière en une instance de modèle par compilation, puis utilisez l'instance de modèle pour appeler la méthode findall afin de générer un objet de correspondance afin d'obtenir le résultat. Avant de les combiner, examinons d'abord les préréglages de l'expression régulière. . Signification des caractères spéciaux :


 d correspond à n'importe quel nombre décimal ; il est équivalent à la classe [0-9].

D correspond à n'importe quel caractère non numérique ; il est équivalent à la classe [^0-9].

 s correspond à n'importe quel caractère non-espace ; il est équivalent à la classe ["t"n"r"f"v].

 S correspond à n'importe quel caractère autre qu'un espace ; il est équivalent à la classe [ ^ "t" n "r" f "v].

w correspond à n'importe quel caractère alphanumérique ; il équivaut à la classe [a-zA-Z0-9_].

 W correspond à n'importe quel caractère non alphanumérique ; il est équivalent à la classe [^a-zA-Z0-9_].


Après avoir lu la signification de ces caractères spéciaux, donnons un autre exemple pour illustrer l'argument ci-dessus :

import re
str1 = 'asdf12dvdve4gb4'
pattern1 = re.compile('\d')
pattern2 = re.compile('[0-9]')
mch1 = pattern1.findall(str1)
mch2 = pattern2.findall(str1)
print('mch1:\t%s'% mch1)
print('mch2:\t%s'% mch2)
#输出结果
mch1: ['1', '2', '4', '4']13 mch2: ['1', '2', '4', '4']


ci-dessus Les deux exemples of peut bien illustrer l'argument ci-dessus et montrer également que le caractère spécial d est bien le même que [0-9]. Cela peut être vu à partir des résultats de sortie, alors si vous ne voulez pas mettre chaque nombre divisé en un seul. élément et placez-le dans la liste, mais si vous souhaitez afficher 12 dans son ensemble, alors vous pouvez faire ceci : (Cela est obtenu en ajoutant un nombre après d. Le nombre ici signifie en mettre un ou plusieurs. La sortie entière de connecté nombres décimaux)

import re
str1 = 'asdf12dvdve4gb4'
pattern1 = re.compile('\d+')
pattern2 = re.compile('[0-9]')
mch1 = pattern1.findall(str1)
mch2 = pattern2.findall(str1)
print('mch1:\t%s'% mch1)
print('mch2:\t%s'% mch2)
#输出结果
mch1: ['12', '4', '4']
mch2: ['1', '2', '4', '4']


Donnons un autre petit exemple. Cet exemple combine les caractères spéciaux et la sous-fonction de re pour réaliser la sous-fonction de string. :

import re
str1 = 'asd \tf12d vdve4gb4'
new_str = re.sub('\s*','',str)
print(new_str)
#输出结果
asdf12dvdve4gb4


5. Métacaractères :


Ce que nous appelons habituellement les caractères binaires comprennent 2 métacaractères : . ^ $ * ? { } [ ] | ( )


  Les métacaractères que nous examinons en premier sont "[" et "]". Ils sont souvent utilisés pour spécifier une catégorie de caractères, c'est-à-dire un jeu de caractères auquel vous souhaitez faire correspondre. Les caractères peuvent être répertoriés individuellement, ou deux caractères

donnés séparés par un signe "-" peuvent être utilisés pour représenter une plage de caractères. Par exemple, [abc] correspondra à n'importe quel caractère parmi « a », « b » ou « c » ; vous pouvez également utiliser l'intervalle [a-c] pour représenter le même jeu de caractères, ce qui a le même effet que le premier. Si vous souhaitez uniquement faire correspondre les lettres minuscules, alors RE doit être écrit [a-z]. Les métacaractères n'ont aucun effet dans les catégories. Par exemple, [akm$] correspondra à n'importe lequel des caractères « a », « k », « m » ou « $ » ; « $ » est généralement utilisé comme métacaractère, mais dans la classe de caractères, ses caractéristiques sont supprimées. , Revenir au symbole de caractère normal
.

    []:元字符[]表示字符类,在一个字符类中,只有字符^、-、]和\有特殊含义。字符\仍然表示转义,字符-可以定义字符范围,字符^放在前面,表示非.(这个在上面的特殊字符示例中也有提现),

    + 匹配+号前内容1次至无限次
    ? 匹配?号前内容0次到1次
    {m} 匹配前面的内容m次
    {m,n} 匹配前面的内容m到n次

    下面通过一个小例子,来阐述一下上面的字符在元字符[]中的使用:(在下面的这个例子中,要注意的有两点:一是在\d+后面的?号的含义,二是在匹配的前面加上了一个字符r,其实在这个示例中,加与不加都可以显示一样的结果)

>>> import re
>>> print(re.findall(r"a(\d+?)","a123b"))
['1']
>>> print(re.findall(r"a(\d+)","a123b"))
['123']
>>>


以上所述是小编给大家介绍的python 正则表达式学习小结,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对PHP中文网的支持!

更多python 正则表达式学习小结相关文章请关注PHP中文网!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn