>  기사  >  백엔드 개발  >  Python에서 정규식을 사용하여 텍스트에서 특정 단어를 추출하는 방법은 무엇입니까?

Python에서 정규식을 사용하여 텍스트에서 특정 단어를 추출하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-12 14:45:02719검색

How to Extract Specific Words from Text Using Regular Expressions in Python?

Python에서 정규식을 사용하여 패턴 일치 추출

Python에서 정규식(regex)은 문자열에서 데이터를 일치시키고 추출하는 강력한 방법을 제공합니다. 일반적인 사용 사례 중 하나는 더 큰 텍스트 내에서 특정 단어나 패턴을 식별하고 검색하는 것입니다.

예제 문자열을 고려하세요.

someline abc
someother line
name my_user_name is valid
some more lines

우리의 목표는

패턴 일치

첫 번째 단계는 원하는 패턴과 일치하는 정규식 패턴을 만드는 것입니다. 이 경우 "name"으로 시작하고 그 뒤에 임의의 문자열이 오고 "is valid"로 끝나는 줄을 일치시키려고 합니다. 다음 정규식을 사용할 수 있습니다.

"name .* is valid"

여기에서 "name"은 문자 그대로의 단어 "name"과 일치하고 ".*"는 모든 문자 시퀀스(공백 포함)와 일치하며 "is valid"는 리터럴 문자열. 아래와 같이 re.compile()을 사용하여 패턴을 컴파일합니다.

import re
s = """
someline abc
someother line
name my_user_name is valid
some more lines
"""
p = re.compile("name .* is valid")

이제 컴파일된 패턴을 사용하여 문자열에서 일치하는 항목을 검색할 수 있습니다. p.match(s) 메소드는 발견된 첫 번째 일치 항목을 나타내는 객체를 반환합니다.

사용자 이름 추출

일치 객체가 있으면 그룹( ) 방법. 괄호 안의 숫자는 검색할 캡처 그룹을 지정합니다. 우리의 경우에는 group(1)으로 표시되는 캡처 그룹이 하나만 있습니다.

match = p.match(s)  # finds the first match
print(match.group(1))  # prints "my_user_name"

정규 표현식과 group() 메서드를 사용하면 더 큰 그룹에서 특정 단어나 패턴을 효율적으로 추출할 수 있습니다. 텍스트 데이터세트.

위 내용은 Python에서 정규식을 사용하여 텍스트에서 특정 단어를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.