Heim >Backend-Entwicklung >Python-Tutorial >Detaillierte Erklärung regulärer Ausdrücke in Python
Reguläre Ausdrücke werden verwendet, um eine Reihe von Zeichenfolgen präzise auszudrücken. Dieser Artikel vermittelt Ihnen hauptsächlich die detaillierten Kenntnisse über reguläre Ausdrücke in Python und hofft, allen zu helfen.
Operator | Beschreibung | Instanz | |||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
. | Stellt ein beliebiges einzelnes Zeichen dar |
|
|||||||||||||||||||||||||||||||||||||||||||||
[ ] | Zeichensatz, Einzelzeichen-Wertebereich |
[abc] bedeutet a oder b oder c; [a-z] bedeutet ein einzelnes Zeichen von a bis z |
|||||||||||||||||||||||||||||||||||||||||||||
[^ ] | Nicht-Zeichensatz, Ausschlussbereich für einzelne Zeichen |
[^abc] bedeutet nicht a oder nicht b oder nicht c |
|||||||||||||||||||||||||||||||||||||||||||||
* | 0 oder unendliche Erweiterungen des vorherigen Zeichens | abc* code> bedeutet <code>ab, abc, abcc, abccc... |
|||||||||||||||||||||||||||||||||||||||||||||
+ | 1 Mal oder unendlich des vorherigen Zeichens Untererweiterung |
abc+ bedeutet abc, abcc, abccc...
|
|||||||||||||||||||||||||||||||||||||||||||||
? td> | 0 oder 1 Erweiterung des vorherigen Zeichens |
abc? bedeutet ab, abc
|
|||||||||||||||||||||||||||||||||||||||||||||
Links und rechts bedeutet irgendein |
abc|def bedeutet abc oder def
| ||||||||||||||||||||||||||||||||||||||||||||||
{m} | M-fache Erweiterung des vorherigen Zeichens |
ab{2} bedeutet abcc
|
|||||||||||||||||||||||||||||||||||||||||||||
{m,n} | M bis n Erweiterungen des vorherigen Zeichens (einschließlich n) | ab{1,2} bedeutet, dass abc, abcc
|
|||||||||||||||||||||||||||||||||||||||||||||
^ | mit dem Anfang der Zeichenfolge übereinstimmt |
^abc bedeutet abc und steht am Anfang einer Zeichenfolge. |
|||||||||||||||||||||||||||||||||||||||||||||
$ | entspricht dem string End |
abc$ bedeutet abc und wird am Ende einer Zeichenfolge gruppiert |
|||||||||||||||||||||||||||||||||||||||||||||
( ) | Hinweis, nur der |.-Operator
(abc|def) kann intern zur Darstellung von abc oder def
|
||||||||||||||||||||||||||||||||||||||||||||||
d | Zahl, entspricht [0-9] | ||||||||||||||||||||||||||||||||||||||||||||||
w | Wortzeichen, entspricht [A-Za-z0-9_] |
Wenn Sie mit den oben genannten Operatoren vertraut sind, ist das folgende Beispiel nicht schwierig.
1. Es können nur Zahlen eingegeben werden: ^[0-9]*$
2. Es können nur n-stellige Zahlen eingegeben werden: ^d{n}$
3 .Es können nur Zahlen mit mindestens n Ziffern eingegeben werden: ^d{n,}$
4. Es können nur Zahlen mit m~n Ziffern eingegeben werden: ^d{m,n}$
5 .Es können nur Zahlen eingegeben werden, die mit Null und ungleich Null beginnen: ^(0|[1-9][0-9]*)$
6 Nur positive reelle Zahlen mit zwei Dezimalstellen können eingegeben werden: ^[ 0-9]+(.[0-9]{2})?$
7 Es können nur positive reelle Zahlen mit 1 bis 3 Dezimalstellen eingegeben werden: ^[ 0-9]+(.[0 -9]{1,3})?$
函数 | 说明 |
---|---|
re.match() | 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。 |
re.search() | 扫描整个字符串并返回第一个成功的匹配。 |
re.sub() | 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串 |
re.findall() | 搜索字符串,以列表形式返回全部能匹配的子串 |
re.split() | 将字符串按照正则表达式匹配结果进行切割,返回列表 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
>>> match= re.findall(r'[1-9]\d{5}','100081BIT BIT10008676')>>> print(match) ['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676')>>> match ['', 'BIT BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676',maxsplit=1)>>> match ['', 'BIT BIT10008676'] >>>for m in re.finditer(r'[1-9]\d{5}','100081BIT BIT10008676'): if m: print(m.group(0)) 100081100086
re.match stimmt nur mit dem Anfang der Zeichenfolge überein. Wenn der Anfang der Zeichenfolge nicht mit dem regulären Ausdruck übereinstimmt, schlägt die Übereinstimmung fehl Die Funktion gibt None zurück und re.search gleicht die gesamte Zeichenfolge ab, bis eine Übereinstimmung gefunden wird.
操作符 | 说明 | 实例 |
---|---|---|
. | 表示任何单个字符 | |
[ ] | 字符集,单个字符取值范围 |
[abc] 表示a或b或c; [a-z]表示a到z单个字符 |
[^ ] | 非字符集,单个字符排除范围 |
[^abc] 表示非a或非b或非c |
* | 前一个字符的0次或无限次扩展 |
abc* 表示ab、abc、abcc、abccc...
|
+ | 前一个字符的1次或无限次扩展 |
abc+ 表示abc、abcc、abccc...
|
? | 前一个字符的0次或1次扩展 |
abc? 表示ab、abc
|
| | 左右表示任意一个 |
abc|def 表示abc或def
|
{m} | 前一个字符的m次扩展 |
ab{2} 表示abcc
|
{m,n} | 前一个字符的m至n次扩展(含n) |
ab{1,2} 表示abc、abcc
|
^ | 匹配字符串开头 |
^abc 表示abc且在一个字符串的开头 |
$ | 匹配字符串结尾 |
abc$ 表示abc且在一个字符串的结尾 |
( ) | 分组标记,内部只能使用|操作符 |
(abc|def) 表示abc或def
|
d | 数字,等价于[0-9] | |
w | 单词字符,等价于[A-Za-z0-9_] |
Wenn Sie mit den oben genannten Operatoren vertraut sind, ist das folgende Beispiel nicht schwierig.
1. Es können nur Zahlen eingegeben werden: ^[0-9]*$
2. Es können nur n-stellige Zahlen eingegeben werden: ^d{n}$
3 .Es können nur Zahlen mit mindestens n Ziffern eingegeben werden: ^d{n,}$
4. Es können nur Zahlen mit m~n Ziffern eingegeben werden: ^d{m,n}$
5 .Es können nur Zahlen eingegeben werden, die mit Null und ungleich Null beginnen: ^(0|[1-9][0-9]*)$
6 Nur positive reelle Zahlen mit zwei Dezimalstellen können eingegeben werden: ^[ 0-9]+(.[0-9]{2})?$
7 Es können nur positive reelle Zahlen mit 1 bis 3 Dezimalstellen eingegeben werden: ^[ 0-9]+(.[0 -9]{1,3})?$
8 Es können nur positive Ganzzahlen ungleich Null eingegeben werden: ^+?[1-9][0-9 ]*$
[Python3 regulärer Ausdruck]
函数 | 说明 |
---|---|
re.match() | 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。 |
re.search() | 扫描整个字符串并返回第一个成功的匹配。 |
re.sub() | 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串 |
re.findall() | 搜索字符串,以列表形式返回全部能匹配的子串 |
re.split() | 将字符串按照正则表达式匹配结果进行切割,返回列表 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
>>> match= re.findall(r'[1-9]\d{5}','100081BIT BIT10008676')>>> print(match) ['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676')>>> match ['', 'BIT BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676',maxsplit=1)>>> match ['', 'BIT BIT10008676'] >>>for m in re.finditer(r'[1-9]\d{5}','100081BIT BIT10008676'): if m: print(m.group(0)) 100081100086
re.match stimmt nur überein der Anfang der Zeichenfolge, wenn der Anfang der Zeichenfolge nicht mit dem regulären Ausdruck übereinstimmt, schlägt die Übereinstimmung fehl und die Funktion gibt None zurück, während re.search die gesamte Zeichenfolge abgleicht, bis eine Übereinstimmung gefunden wird.
Verwandte Empfehlungen:
Detaillierte Erklärung der regulären js-Ausdrücke
php regulär Ausdrücke Ausführliche Erklärung von Ausdrücken_PHP-Tutorial
Das obige ist der detaillierte Inhalt vonDetaillierte Erklärung regulärer Ausdrücke in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!