정규식은 문자열 일치, 추출 및 교체 작업을 쉽게 수행하는 데 도움이 되는 강력한 문자열 처리 도구입니다. Python에서는 re 모듈에서 제공하는 함수와 메서드를 사용하여 정규식 관련 작업을 구현할 수 있습니다. 이 기사에서는 문자열 일치를 위해 Python 정규식을 사용하는 방법을 소개합니다.
1. 기본 정규식 구문
Python 정규식을 사용할 때는 몇 가지 기본 구문 규칙을 이해해야 합니다. 다음은 일반적으로 사용되는 정규식 기호와 의미입니다.
예를 들어 ^ 및 $를 사용하면 전체 문자열을 정확하게 일치시킬 수 있습니다.
import re pattern = "^hello$" string = "hello" result = re.match(pattern, string) print(result)
출력 결과는 다음과 같습니다.
<re.Match object; span=(0, 5), match='hello'>
위 코드에서 ^hello$의 의미는 hello로 시작하고 끝나는 문자열을 일치시키는 것입니다. 문자열이 이 조건을 정확히 충족하므로 re.match는 일치 개체를 반환합니다. 일치가 실패하면 반환 값은 None입니다.
2. re.match 함수
re.match 함수는 주어진 문자열의 시작 부분에서 정규식을 일치시킬 수 있으며, 일치에 성공하면 일치하는 개체를 반환하고, 그렇지 않으면 None을 반환합니다. 다음은 re.match를 사용한 예입니다.
import re pattern = "^hello$" string = "hello, world!" result = re.match(pattern, string) if result: print("匹配成功") else: print("匹配失败")
위 코드에서 문자열 문자열이 정규식 패턴의 조건을 충족하지 않으므로 re.match는 None을 반환하고 출력 결과는 "match failed"입니다.
3. re.search 함수
re.search 함수는 전체 문자열에서 정규식을 일치시킬 수 있습니다. 일치에 성공하면 일치하는 개체를 반환하고, 그렇지 않으면 None을 반환합니다. 다음은 re.search를 사용하는 예입니다.
import re pattern = "world" string = "hello, world!" result = re.search(pattern, string) if result: print("匹配成功") else: print("匹配失败")
위 코드에서 문자열 문자열에 world 하위 문자열이 포함되어 있으므로 re.search는 일치하는 개체를 반환하고 출력 결과는 "일치 성공"입니다.
4. re.findall 함수
re.findall 함수는 전체 문자열에서 정규식과 일치하는 모든 하위 문자열을 포함하는 목록을 반환할 수 있습니다. 다음은 re.findall을 사용하는 예입니다.
import re pattern = "d+" string = "hello, 123 world! 456" result = re.findall(pattern, string) print(result)
위 코드에서 정규식 d+는 하나 이상의 숫자와 일치할 수 있으므로 re.findall은 123과 456이 포함된 목록을 반환합니다.
5. re.sub 함수
re.sub 함수는 정규식과 일치하는 모든 하위 문자열을 지정된 문자열로 바꿀 수 있습니다. 다음은 re.sub 사용의 예입니다.
import re pattern = "d+" string = "hello, 123 world! 456" result = re.sub(pattern, "number", string) print(result)
위 코드에서 정규식 d+는 하나 이상의 숫자와 일치할 수 있으므로 re.sub는 123과 456을 모두 문자열 "number"로 바꿉니다.
6. re.split 함수
re.split 함수는 정규식을 사용하여 문자열을 분할할 수 있습니다. 다음은 re.split 사용 예입니다.
import re pattern = "s+" string = "hello, world!" result = re.split(pattern, string) print(result)
위 코드에서 정규식 s+는 하나 이상의 공백과 일치할 수 있으므로 re.split은 문자열의 공백을 구분 기호로 사용하여 문자열을 분할합니다. 출력은 ["hello,", "world!"] 두 개의 문자열입니다.
7. 요약
이 글에서는 문자열 일치를 위해 Python 정규식을 사용하는 방법을 소개합니다. 기본 정규식 구문과 re 모듈이 제공하는 함수 및 메서드를 숙지함으로써 문자열 처리 및 텍스트 마이닝을 보다 효율적으로 수행하는 데 도움을 줄 수 있습니다. 정규식은 종종 일부 특수 문자를 사용하므로 이스케이프해야 합니다. 그렇지 않으면 예기치 않은 오류가 발생합니다. 정규식에 대해 자세히 알아보려면 관련 튜토리얼 및 문서를 참조하세요.
위 내용은 문자열 일치를 위해 Python 정규식을 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!