Maison  >  Article  >  développement back-end  >  Explication détaillée des expressions régulières en Python

Explication détaillée des expressions régulières en Python

小云云
小云云original
2017-12-18 15:05:402004parcourir


Les expressions régulières sont des expressions utilisées pour exprimer de manière concise un ensemble de chaînes. Cet article partage principalement avec vous la connaissance détaillée des expressions régulières en Python, dans l'espoir d'aider tout le monde.

| Mark, seul l'opérateur |
Opérateur Description Instance
. Représente n'importe quel caractère unique
操作符 说明 实例
. 表示任何单个字符
[ ] 字符集,单个字符取值范围 [abc]表示a或b或c; [a-z]表示a到z单个字符
[^ ] 非字符集,单个字符排除范围 [^abc]表示非a或非b或非c
* 前一个字符的0次或无限次扩展 abc*表示ab、abc、abcc、abccc...
+ 前一个字符的1次或无限次扩展 abc+表示abc、abcc、abccc...
? 前一个字符的0次或1次扩展 abc?表示ab、abc
| 左右表示任意一个 abc|def 表示abc或def
{m} 前一个字符的m次扩展 ab{2}表示abcc
{m,n} 前一个字符的m至n次扩展(含n) ab{1,2}表示abc、abcc
^ 匹配字符串开头 ^abc表示abc且在一个字符串的开头
$ 匹配字符串结尾 abc$表示abc且在一个字符串的结尾
( ) 分组标记,内部只能使用|操作符 (abc|def)表示abc或def
d 数字,等价于[0-9]
w 单词字符,等价于[A-Za-z0-9_]
[ ] Jeu de caractères, plage de valeurs d'un seul caractère [abc] signifie a ou b ou c ; [a-z] signifie un seul caractère de a à z
[^ ] Jeu sans caractères, plage d'exclusion d'un seul caractère [^abc] signifie pas a ou pas b ou non c
* 0 ou expansions infinies du caractère précédent abc* code> signifie <code>ab, abc, abcc, abccc...
+ 1 fois ou l'infini du caractère précédent Sous-expansion abc+ signifie abc, abcc, abccc...
 ? td> 0 ou 1 expansion du caractère précédent abc? signifie ab, abc
La gauche et la droite représentent n'importe lequel d'entre eux abc|def représente abc ou def
{m} M fois l'expansion du caractère précédent ab{2} signifie abcc
{m,n> M à n extensions du caractère précédent (y compris n) ab{1,2} signifie que abc, abcc
^ correspond au début de la chaîne ^abc signifie abc et se trouve au début d'une chaîne
$ correspond au fin de chaîne abc$ signifie abc et est regroupé à la fin d'une chaîne
( ) (abc|def) peut être utilisé en interne pour représenter abc ou def
d Nombre, équivalent à [0-9]

w Caractère de mot, équivalent à [A-Za-z0-9_]

Si vous êtes familier avec les opérateurs ci-dessus, l'exemple suivant n'est pas difficile.

1. Seuls les nombres peuvent être saisis : ^[0-9]*$

2. Seuls les nombres à n chiffres peuvent être saisis : ^d{n}$

3 .Seuls les nombres avec au moins n chiffres peuvent être saisis : ^d{n,}$

4 Seuls les nombres avec m~n chiffres peuvent être saisis : ^d{m,n}$

5 .Seuls les nombres commençant par zéro et non nuls peuvent être saisis : ^(0|[1-9][0-9]*)$

6. Seuls les nombres réels positifs avec deux. les décimales peuvent être saisies : ^[ 0-9]+(.[0-9]{2})?$

7. Seuls les nombres réels positifs avec 1 à 3 décimales peuvent être saisis : ^[ 0-9]+(.[0 -9]{1,3})?$

8. Seuls les entiers positifs non nuls peuvent être saisis : ^+?[1-9][0-9]. ]*$


【Expression régulière Python3】

函数 说明
re.match() 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。
re.search() 扫描整个字符串并返回第一个成功的匹配。
re.sub() 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串
re.findall() 搜索字符串,以列表形式返回全部能匹配的子串
re.split() 将字符串按照正则表达式匹配结果进行切割,返回列表
re.finditer() 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
>>> match= re.findall(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;)>>> print(match)
[&#39;100081&#39;, &#39;100086&#39;]>>> match = re.split(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;)>>> match
[&#39;&#39;, &#39;BIT  BIT&#39;, &#39;76&#39;]>>> match = re.split(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;,maxsplit=1)>>> match
[&#39;&#39;, &#39;BIT  BIT10008676&#39;]

>>>for m in re.finditer(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;):       if m:
            print(m.group(0))    
100081100086

La différence entre re.match et re.search

re.match ne correspond qu'au début de la chaîne. Si le début de la chaîne ne correspond pas à l'expression régulière, la correspondance échoue et. la fonction renvoie Aucun ; et re.search correspond à la chaîne entière jusqu'à ce qu'une correspondance soit trouvée.


Explication détaillée des expressions régulières en Python

操作符 说明 实例
. 表示任何单个字符
[ ] 字符集,单个字符取值范围 [abc]表示a或b或c; [a-z]表示a到z单个字符
[^ ] 非字符集,单个字符排除范围 [^abc]表示非a或非b或非c
* 前一个字符的0次或无限次扩展 abc*表示ab、abc、abcc、abccc...
+ 前一个字符的1次或无限次扩展 abc+表示abc、abcc、abccc...
? 前一个字符的0次或1次扩展 abc?表示ab、abc
| 左右表示任意一个 abc|def 表示abc或def
{m} 前一个字符的m次扩展 ab{2}表示abcc
{m,n} 前一个字符的m至n次扩展(含n) ab{1,2}表示abc、abcc
^ 匹配字符串开头 ^abc表示abc且在一个字符串的开头
$ 匹配字符串结尾 abc$表示abc且在一个字符串的结尾
( ) 分组标记,内部只能使用|操作符 (abc|def)表示abc或def
d 数字,等价于[0-9]
w 单词字符,等价于[A-Za-z0-9_]

Si vous êtes familier avec les opérateurs ci-dessus, l'exemple suivant n'est pas difficile.

1. Seuls les nombres peuvent être saisis : ^[0-9]*$

2. Seuls les nombres à n chiffres peuvent être saisis : ^d{n}$

3 .Seuls les nombres avec au moins n chiffres peuvent être saisis : ^d{n,}$

4 Seuls les nombres avec m~n chiffres peuvent être saisis : ^d{m,n}$

5 .Seuls les nombres commençant par zéro et non nuls peuvent être saisis : ^(0|[1-9][0-9]*)$

6. Seuls les nombres réels positifs avec deux. les décimales peuvent être saisies : ^[ 0-9]+(.[0-9]{2})?$

7. Seuls les nombres réels positifs avec 1 à 3 décimales peuvent être saisis : ^[ 0-9]+(.[0 -9]{1,3})?$

8. Seuls les entiers positifs non nuls peuvent être saisis : ^+?[1-9][0-9]. ]*$

[Expression régulière Python3]

函数 说明
re.match() 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。
re.search() 扫描整个字符串并返回第一个成功的匹配。
re.sub() 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串
re.findall() 搜索字符串,以列表形式返回全部能匹配的子串
re.split() 将字符串按照正则表达式匹配结果进行切割,返回列表
re.finditer() 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
La différence entre re.match et re.search
>>> match= re.findall(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;)>>> print(match)
[&#39;100081&#39;, &#39;100086&#39;]>>> match = re.split(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;)>>> match
[&#39;&#39;, &#39;BIT  BIT&#39;, &#39;76&#39;]>>> match = re.split(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;,maxsplit=1)>>> match
[&#39;&#39;, &#39;BIT  BIT10008676&#39;]

>>>for m in re.finditer(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;):       if m:
            print(m.group(0))    
100081100086

re.match correspond uniquement le début de la chaîne, si le début de la chaîne ne correspond pas à l'expression régulière, la correspondance échoue et la fonction renvoie Aucun tandis que re.search correspond à la chaîne entière jusqu'à ce qu'une correspondance soit trouvée ;


Explication détaillée des expressions régulières en PythonRecommandations associées :

Explication détaillée des expressions régulières js

php Regular expressions Explication détaillée du tutoriel expressions_PHP

Explication détaillée très importante des expressions régulières php, explication détaillée des expressions régulières php

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn