>백엔드 개발 >파이썬 튜토리얼 >Python에서 사용자 제공 문자열을 정규식 패턴으로 안전하게 사용하려면 어떻게 해야 합니까?

Python에서 사용자 제공 문자열을 정규식 패턴으로 안전하게 사용하려면 어떻게 해야 합니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-31 00:57:11806검색

How Can I Safely Use User-Supplied Strings as Regex Patterns in Python?

사용자 제공 패턴에서 정규식 문자 이스케이프

사용자 입력을 정규식 패턴으로 활용하는 경우 다음과 같은 문자 문제를 해결하는 것이 중요합니다. 정규식 구문 내에서 특별한 의미를 갖습니다. 예를 들어, "Word(s)"를 검색하려는 사용자의 의도는 괄호로 인해 정규식 엔진에 의해 그룹으로 잘못 해석됩니다. 이를 방지하려면 괄호를 정규식 기호가 아닌 리터럴 문자열로 처리해야 합니다.

기존 접근 방식: 수동 교체

이러한 문자를 이스케이프하는 한 가지 방법은 수동으로 각 인스턴스를 이스케이프된 버전으로 바꿉니다. 예를 들어 "(s)"를 "(s)"로 바꿀 수 있습니다. 그러나 이를 위해서는 가능한 모든 정규식 기호를 고려해야 하며 이는 힘들 수 있습니다.

더 나은 솔루션: re.escape 함수

더 효율적인 솔루션은 Python의 re를 사용하는 것입니다. .escape() 함수는 문자열에서 영숫자가 아닌 문자를 자동으로 이스케이프합니다. 이를 통해 특수 정규식 문자를 리터럴 문자열로 처리할 수 있습니다.

예를 들어 텍스트에서 "Word(s)" 인스턴스를 검색하려면 다음을 사용할 수 있습니다.

def simplistic_plural(word, text):
    word_or_plural = re.escape(word) + 's?'
    return re.match(word_or_plural, text)

이 함수는 텍스트에서 패턴이 발견되면 일치 개체를 반환합니다.

위 내용은 Python에서 사용자 제공 문자열을 정규식 패턴으로 안전하게 사용하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.