>  기사  >  백엔드 개발  >  정규식을 사용하여 문자열을 그룹화하는 방법에 대한 자세한 설명

정규식을 사용하여 문자열을 그룹화하는 방법에 대한 자세한 설명

巴扎黑
巴扎黑원래의
2017-09-21 11:41:581602검색

这篇文章主要给大家介绍了关于利用正则表达式将字符串分组的相关资料,文中分别介绍了利用itertools模块的groupby()方法和利用正则表达式是如何实现的,通过示例代码介绍的非常详细,需要的朋友们下面来一起看看吧。

前言

最近工作中遇到一个问题,需求是碰到'122333<<<<'这种字符串,要将其连贯的部分取出,得出['1', '22', '333', '<<<<']这样的列表,能想到的常规办法,遍历字符串,后一个与前一个逐个比较,这样真的很麻烦!又想到了另外两种方法,话不多说了,来一起看看详细的示例代码:

一、实际上可以借助itertools模块的groupby()方法来处理:


import itertools 
 
Str = &#39;122333<<<<&#39; 
Lst = [] 
for key,group in itertools.groupby(s): 
 Lst.append(list(group)) 
 
print map(lambda x: &#39;&#39;.join(x), Lst)

上面的处理,还是比较有技巧,也能得到想要的输出结果

['1', '22', '333', '<<<<']

二、但更酷点,更技巧处理方式是用正则表达式来处理:


import re 
 
Str = &#39;122333<<<<&#39; 
Lst = [] 
 
Pat = re.compile(r&#39;((.)\2*)&#39;) 
Rst = [x[0] for x in re.findall(Pat, Str)] 
 
print Rst

备注:

      1. (.)                # .匹配任意字符;(.)做分组,方便后面反向引用

      2. \2*                # \2对里面括号的反向引用;*代表是0个到多个;

      3. ((.)\2*)           # 连起来就是任意一个或多个字符组成的分组;

      4. (.)\1*             # 这种方式则可以取出唯一的值['1', '2', '3', '<'];同样非常方便

위 내용은 정규식을 사용하여 문자열을 그룹화하는 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.