Python Regex로 패턴 추출
텍스트 데이터를 다룰 때 특정 패턴을 추출하는 것은 일반적인 작업이 될 수 있습니다. 정규식은 이러한 목적을 위한 강력한 도구로, 프로그래머가 더 큰 문자열 내에서 일치하는 패턴을 캡처할 수 있도록 해줍니다.
주어진 문자열에서 "my_user_name"이라는 단어를 검색하려는 다음 예를 고려해 보세요.
someline abc someother line name my_user_name is valid some more lines
re 모듈을 사용하여 먼저 정규식 패턴을 컴파일합니다.
p = re.compile("name .* is valid", re.flags)
re.flags 인수는 re.IGNORECASE 또는 re.DOTALL과 같은 선택적 플래그 수정자를 허용합니다. 이 경우에는 수정자를 사용하지 않습니다.
문자열에서 일치하는 패턴을 찾으려면 match 메서드를 사용합니다.
p.match(s) # this gives me <_sre.SRE_Match object at 0x026B6838>
그러나 match 메서드는 메타데이터만 반환합니다. 실제 일치하는 텍스트를 캡처하지 않고 일치에 대해 설명합니다. 캡처된 부분을 추출하려면 그룹 방법을 사용해야 합니다.
result = p.search(s) if result: user_name = result.group(1)
result.group(1) 표현식은 정규식 내의 첫 번째 캡처 그룹(이 경우 "my_user_name"이라는 단어)을 캡처합니다. ". user_name에 할당함으로써 문자열에서 원하는 패턴을 효과적으로 추출했습니다.
위 내용은 Python Regex를 사용하여 텍스트 데이터에서 특정 패턴을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!