이 글은 Python의 re 모듈과 정규 표현식(코드 포함)에 대한 소개를 제공합니다. 이는 특정 참조 가치가 있으므로 도움이 필요한 친구에게 도움이 되기를 바랍니다.
정규 표현식(영어: 정규 표현식, 코드에서 종종 regex, regexp 또는 RE로 약칭됨)은 정규 표현식, 정규 표현식, 정규 표현식, 정규 표현식, 정규 표기법이라고도 알려져 있으며 컴퓨터 과학 개념의 용어입니다. 정규식은 단일 문자열을 사용하여 특정 구문 규칙과 일치하는 일련의 문자열을 설명하고 일치시킵니다. 많은 텍스트 편집기에서는 특정 패턴과 일치하는 텍스트를 검색하고 바꾸는 데 정규식을 사용하는 경우가 많습니다. RERGULAL 표현 규칙, 단일 문자 일치
Function | Rephere example | 매치 일치 예 | |
---|---|---|---|
B .B .B .B .B .B .B. | bab,b2b | ||
[ ] | 은 []에 설정된 문자 집합의 모든 문자와 일치합니다. | i [abCde]m | i am |
d | 은 모든 10진수와 일치하며 [ 0 -9] 일관성 | wdcschool | w3cschool |
D | 은 숫자가 아닌 문자와 일치합니다. 즉, 숫자가 아닌 | mouDh | mouth |
s | 은 모든 공백 문자와 일치합니다. [ntrvf]와 동일 | islike | i like |
S | 는 공백이 아닌 모든 문자와 일치하지만 s | nSe | noe,n3e |
w | 은 모든 영숫자 문자와 일치합니다. Za-z0-9_ ]동일 | [A-Za-z]w+ | |
W | 은 단어가 아닌 문자와 일치 | [0-9]W[A-Z] | 3 A |
Character | Function | 정규 표현식 예시 | 일치 예시 | |
---|---|---|---|---|
* | 이전 정규 표현식과 0회 이상 일치 , 선택사항 | a* ㅋㅋㅋ | 문자를 일치시키기 전 1번 또는 0번 나타납니다. 한 번이든 아니든a? |
a 또는 b |
{m} | 은 이전 문자와 m번 나타납니다. | [0-9] {5} |
12345 |
|
{m.} | 이전 문자가 m번 이상 나타나는 것과 일치합니다 | a{5.} |
aaaaa |
|
{m, n} | 이전 항목과 일치 m에서 n번까지 나타나는 문자 | a{2,6} |
aaa |
|
은 경계 일치를 나타냅니다. |
문자 |
|||
정규 표현식 예 | Theb | B | 단어가 아닌 경계와 일치 | .*Bver
characters | function | |
---|---|---|
왼쪽이나 오른쪽의 어떤 표현과도 일치하세요 | ||
(ab) | 괄호 안의 문자를 그룹으로 처리합니다 | |
num | ||
(?P< 이름>) |
(?P=name) | 별칭 이름 그룹과 일치하는 문자열 인용하기 | |||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
파이썬에서는 내장된 re 모듈 정규식을 사용하려면 | re 모듈 공통 함수 및 메서드 | |||||||||||||||||||||||||||||||||
설명 | ||||||||||||||||||||||||||||||||||
옵션 플래그를 사용하여 정규식 패턴을 컴파일합니다. 그런 다음 정규식 개체를 반환합니다 |
Match 개체를 사용합니다. 제공된 속성과 메서드(예: group() )를 사용하여 정보를 얻고 다음과 같은 다른 작업을 수행합니다. 필요합니다. re 모듈 사용 예
re模块使用示例导入模块 import re # 将正则表达式编译成pattern对象 pattern = re.compile(r'\d+')
match(string[, pos[, endpos]]) 编译成正则表达式对象后,就可以使用上面所说的正则表达式对象方法了。
>>> import re >>> >>> pattern = re.compile(r'\d+') # 正则表达式表示匹配至少一个数字 >>> >>> m = pattern.match("one2three4") # match默认从开头开始匹配,开头是字母o,所以没有匹配成功 >>> print(m) # 匹配失败返回None None >>> >>> m = pattern.match("1two3four") # 开头字符是数字,匹配成功 >>> print(m) <_sre.SRE_Match object; span=(0, 1), match='1'> >>> >>> m.group() # group()方法获取匹配成功的字符 '1' >>> m = pattern.match("onetwo3four56",6,12) # 指定match从数字3开始查找,第一个是数字3,匹配成功 >>> print(m) <_sre.SRE_Match object; span=(6, 7), match='3'> >>> m.group() '3' 其中,string是待匹配的字符串,pos 和 endpos 是可选参数,指定字符串的 rrreee 정규식 개체로 컴파일한 후 위에서 언급한 정규식 개체 방법을 사용할 수 있습니다.match() 메서드🎜 match 메서드는 문자열의 선두를 찾는 데 사용되며(시작 위치도 지정할 수 있음) 한 번 일치, 일치하는 결과가 발견되면 일치하는 모든 결과를 검색하는 대신 반환됩니다. 일반적인 사용 형식은 다음과 같습니다. 🎜rrreee🎜여기서 string은 일치시킬 문자열이고 pos 및 endpos는 문자열의 <code>start 및 end 를 지정하는 선택적 매개변수입니다. 위치, 기본값은 각각 0과 len (문자열 길이)입니다. 따라서 pos 및 endpos를 지정하지 않으면 일치 방법은 기본적으로 문자열의 헤드를 일치시키는 것으로 설정됩니다. 🎜🎜일치에 성공하면 Match 개체가 반환됩니다. 일치하는 항목이 없으면 None이 반환됩니다. 🎜rreee🎜🎜
|
위 내용은 Python의 re 모듈 및 정규식 소개(코드 포함)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!