正则表达式是用来简洁表达一组字符串的表达式,本文主要和大家分享Python 中正则表达式知识详解,希望能帮助到大家。
操作符 | 说明 | 实例 | |||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
. | 表示任何单个字符 |
|
|||||||||||||||||||||||||||||||||||||||||||||
[ ] | 字符集,单个字符取值范围 |
[abc] 表示a或b或c; [a-z]表示a到z单个字符 |
|||||||||||||||||||||||||||||||||||||||||||||
[^ ] | 非字符集,单个字符排除范围 |
[^abc] 表示非a或非b或非c |
|||||||||||||||||||||||||||||||||||||||||||||
* | 前一个字符的0次或无限次扩展 |
abc* 表示ab、abc、abcc、abccc...
|
|||||||||||||||||||||||||||||||||||||||||||||
前一个字符的1次或无限次扩展 |
abc 表示abc、abcc、abccc...
|
||||||||||||||||||||||||||||||||||||||||||||||
? | 前一个字符的0次或1次扩展 |
abc? 表示ab、abc
|
|||||||||||||||||||||||||||||||||||||||||||||
| | 左右表示任意一个 |
abc|def 表示abc或def
|
|||||||||||||||||||||||||||||||||||||||||||||
{m} | 前一个字符的m次扩展 |
ab{2} 表示abcc
|
|||||||||||||||||||||||||||||||||||||||||||||
{m,n} | 前一个字符的m至n次扩展(含n) |
ab{1,2} 表示abc、abcc
|
|||||||||||||||||||||||||||||||||||||||||||||
^ | 匹配字符串开头 |
^abc 表示abc且在一个字符串的开头 |
|||||||||||||||||||||||||||||||||||||||||||||
$ | 匹配字符串结尾 |
abc$ 表示abc且在一个字符串的结尾 |
|||||||||||||||||||||||||||||||||||||||||||||
( ) | 分组标记,内部只能使用|操作符 |
(abc|def) 表示abc或def
|
|||||||||||||||||||||||||||||||||||||||||||||
d | 数字,等价于[0-9] | ||||||||||||||||||||||||||||||||||||||||||||||
w | 单词字符,等价于[A-Za-z0-9_] |
如果熟悉上面的操作符的话,下面的例子就不难了。
1.只能输入数字:^[0-9]*$
2.只能输入n位的数字:^d{n}$
3.只能输入至少n位的数字:^d{n,}$
4.只能输入m~n位的数字:^d{m,n}$
5.只能输入零和非零开头的数字:^(0|[1-9][0-9]*)$
6.只能输入有两位小数的正实数:^[0-9] (.[0-9]{2})?$
7.只能输入有1~3位小数的正实数:^[0-9] (.[0-9]{1,3})?$
8.只能输入非零的正整数:^ ?[1-9][0-9]*$
函数 | 说明 |
---|---|
re.match() | 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。 |
re.search() | 扫描整个字符串并返回第一个成功的匹配。 |
re.sub() | 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串 |
re.findall() | 搜索字符串,以列表形式返回全部能匹配的子串 |
re.split() | 将字符串按照正则表达式匹配结果进行切割,返回列表 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
>>> match= re.findall(r'[1-9]\d{5}','100081BIT BIT10008676')>>> print(match) ['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676')>>> match ['', 'BIT BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676',maxsplit=1)>>> match ['', 'BIT BIT10008676'] >>>for m in re.finditer(r'[1-9]\d{5}','100081BIT BIT10008676'): if m: print(m.group(0)) 100081100086
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
操作符 | 说明 | 实例 |
---|---|---|
. | 表示任何单个字符 | |
[ ] | 字符集,单个字符取值范围 |
[abc] 表示a或b或c; [a-z]表示a到z单个字符 |
[^ ] | 非字符集,单个字符排除范围 |
[^abc] 表示非a或非b或非c |
* | 前一个字符的0次或无限次扩展 |
abc* 表示ab、abc、abcc、abccc...
|
前一个字符的1次或无限次扩展 |
abc 表示abc、abcc、abccc...
|
|
? | 前一个字符的0次或1次扩展 |
abc? 表示ab、abc
|
| | 左右表示任意一个 |
abc|def 表示abc或def
|
{m} | 前一个字符的m次扩展 |
ab{2} 表示abcc
|
{m,n} | 前一个字符的m至n次扩展(含n) |
ab{1,2} 表示abc、abcc
|
^ | 匹配字符串开头 |
^abc 表示abc且在一个字符串的开头 |
$ | 匹配字符串结尾 |
abc$ 表示abc且在一个字符串的结尾 |
( ) | 分组标记,内部只能使用|操作符 |
(abc|def) 表示abc或def
|
d | 数字,等价于[0-9] | |
w | 单词字符,等价于[A-Za-z0-9_] |
如果熟悉上面的操作符的话,下面的例子就不难了。
1.只能输入数字:^[0-9]*$
2.只能输入n位的数字:^d{n}$
3.只能输入至少n位的数字:^d{n,}$
4.只能输入m~n位的数字:^d{m,n}$
5.只能输入零和非零开头的数字:^(0|[1-9][0-9]*)$
6.只能输入有两位小数的正实数:^[0-9] (.[0-9]{2})?$
7.只能输入有1~3位小数的正实数:^[0-9] (.[0-9]{1,3})?$
8.只能输入非零的正整数:^ ?[1-9][0-9]*$
【Python3正则表达式】
函数 | 说明 |
---|---|
re.match() | 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。 |
re.search() | 扫描整个字符串并返回第一个成功的匹配。 |
re.sub() | 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串 |
re.findall() | 搜索字符串,以列表形式返回全部能匹配的子串 |
re.split() | 将字符串按照正则表达式匹配结果进行切割,返回列表 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
>>> match= re.findall(r'[1-9]\d{5}','100081BIT BIT10008676')>>> print(match) ['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676')>>> match ['', 'BIT BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676',maxsplit=1)>>> match ['', 'BIT BIT10008676'] >>>for m in re.finditer(r'[1-9]\d{5}','100081BIT BIT10008676'): if m: print(m.group(0)) 100081100086
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
相关推荐:
以上是Python 中正则表达式详解的详细内容。更多信息请关注PHP中文网其他相关文章!

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。 Python以简洁和强大的生态系统着称,C 则以高性能和底层控制能力闻名。

2小时内可以学会Python的基本编程概念和技能。1.学习变量和数据类型,2.掌握控制流(条件语句和循环),3.理解函数的定义和使用,4.通过简单示例和代码片段快速上手Python编程。

Python在web开发、数据科学、机器学习、自动化和脚本编写等领域有广泛应用。1)在web开发中,Django和Flask框架简化了开发过程。2)数据科学和机器学习领域,NumPy、Pandas、Scikit-learn和TensorFlow库提供了强大支持。3)自动化和脚本编写方面,Python适用于自动化测试和系统管理等任务。

两小时内可以学到Python的基础知识。1.学习变量和数据类型,2.掌握控制结构如if语句和循环,3.了解函数的定义和使用。这些将帮助你开始编写简单的Python程序。

如何在10小时内教计算机小白编程基础?如果你只有10个小时来教计算机小白一些编程知识,你会选择教些什么�...

使用FiddlerEverywhere进行中间人读取时如何避免被检测到当你使用FiddlerEverywhere...

Python3.6环境下加载Pickle文件报错:ModuleNotFoundError:Nomodulenamed...

如何解决jieba分词在景区评论分析中的问题?当我们在进行景区评论分析时,往往会使用jieba分词工具来处理文�...


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

SublimeText3 Linux新版
SublimeText3 Linux最新版

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Atom编辑器mac版下载
最流行的的开源编辑器

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。