首页 >后端开发 >Python教程 >Python中的re.findAll()、re.sub()、set()怎么使用

Python中的re.findAll()、re.sub()、set()怎么使用

王林
王林转载
2023-05-16 10:19:051118浏览

1. re.findall()

re.findall():函数返回包含所有匹配项的列表。返回string中所有与pattern相匹配的全部字串,返回形式为list / 数组。

Python中的re.findAll()、re.sub()、set()怎么使用

由函数原型代码可知,findall() 函数存在三个参数:

1. pattern:正则表达式中的 ‘模式字符串’ ;

2. string:当前需要处理(查找替换)的原始字符串;

3. flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0

# 示例代码
import re
text1 = '北京市海淀区不存在的38街区不想工作大厦99号'
res = re.findall(r'\d+', text1)
print(type(res))
print(res)
# output
# <class &#39;list&#39;>
# [&#39;38&#39;, &#39;99&#39;]

2. re.sub()

re.sub():函数将所有匹配项,替换为选择的文本,并返回结果。

Python中的re.findAll()、re.sub()、set()怎么使用

由函数原型代码可知,re.sub() 函数存在五个参数:

1. pattern:正则表达式中的 ‘模式字符串’ ;

2. repl:需要被替换成的字符串,即将匹配到的pattern替换为repl;可以是函数;

3. string:当前需要处理(查找替换)的原始字符串;        

4. count:可选参数,表示需要替换的最大次数,必须是非负整数;默认值为0,即匹配到的所有子串都进行替换操作;

5. flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0

# 将所有匹配到的‘数字串&#39; 替换为 &#39;520‘
text1 = &#39;北京市海淀区不存在的38街区不想工作大厦99号&#39;
res = re.re(r&#39;\d+&#39;, 520)
print(type(res))
print(res)
# output,返回值res结果是str
# <class &#39;str&#39;>
# 北京市海淀区不存在的520街区不想工作大厦520号

3. set() 

set():python内置函数的其中一个,创建一个无序不重复元素集。支持计算交集、差集、并并集。

# 为list数组l1 去重
l1 = [1, 1, 2, 2, 2, 3, 4]
s1 = set(l1)
print(type(s1))
print(s1)
# output,返回类型是 set
# <class &#39;set&#39;>
# {1, 2, 3, 4}
# 计算l1 和 l2 的交集
l1 = [1, 1, 2, 2, 2, 3, 4]
l2 = [2, 3, 3, 4, 5, 6, 6]
s1 = set(l1)
s2 = set(l2)
u = s1 & s2
print(type(u))
print(u)
# output,返回结果类型set
# <class &#39;set&#39;>
# {2, 3, 4}
# 计算l1 和 l2 的并集, 并集符号 ‘|&#39;,intersection
l1 = [1, 1, 2, 2, 2, 3, 4]
l2 = [2, 3, 3, 4, 5, 6, 6]
s1 = set(l1) # {1, 2, 3, 4}
s2 = set(l2) # {2, 3, 4, 5, 6}
u = s1 | s2
print(type(u))
print(u)
# output,返回结果类型set, 计算 {1, 2, 3, 4} 和 {2, 3, 4, 5, 6} 的并集
# <class &#39;set&#39;>
# {1, 2, 3, 4, 5, 6}
# 计算差集,diff
l1 = [1, 1, 2, 2, 2, 3, 4]
l2 = [2, 3, 3, 4, 5, 6, 6]
s1 = set(l1) # {1, 2, 3, 4}
s2 = set(l2) # {2, 3, 4, 5, 6}
print(s2)
u = s1 - s2
print(type(u))
print(u)
# output,返回结果是set
# <class &#39;set&#39;>
# {1}
# set内也可以传入字符串,会自动转换成list类型
text1 = &#39;北京市海淀区海淀区不想上班不想上班&#39;
res = set(text1)
print(res) # 内部元素是一个个的字,去重 且 无序
# output
# <class &#39;set&#39;>
# {&#39;上&#39;, &#39;北&#39;, &#39;班&#39;, &#39;海&#39;, &#39;淀&#39;, &#39;京&#39;, &#39;不&#39;, &#39;想&#39;, &#39;区&#39;, &#39;市&#39;}

以上是Python中的re.findAll()、re.sub()、set()怎么使用的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:yisu.com。如有侵权,请联系admin@php.cn删除