Python 정규식은 문자열이 특정 패턴과 일치하는지 쉽게 확인할 수 있도록 도와주는 특수 문자 시퀀스입니다. 이 글에서는 Python 정규식을 자세히 설명하고 Python에서 정규식을 알려드립니다. 왜냐하면 이는 어떠한 매칭도 수행하고 우리가 추출하려는 정보와 매칭할 수 있기 때문입니다. Python Regular를 접하게 되면 규칙성의 힘을 알게 될 것입니다. 정규 라이브러리 re가 있습니다. 일부 프로젝트에서는 매칭 관련 문제를 해결하기 위해 정규 라이브러리를 호출하는 경우가 많습니다.
문자열은 프로그래밍에서 가장 일반적으로 관련된 데이터 구조이며 문자열에 대한 작업이 필요한 곳은 거의 모든 곳입니다. 예를 들어, 문자열이 합법적인 이메일 주소인지 확인하려면 프로그래밍 방식으로 @ 전후의 하위 문자열을 추출한 다음 그것이 단어인지, 도메인 이름인지 확인할 수 있지만 이는 번거로울 뿐만 아니라 재사용하기도 어렵습니다. 코드.
정규 표현식은 문자열 일치를 위한 강력한 무기입니다. 그 디자인 아이디어는 설명적 언어를 사용하여 문자열에 대한 규칙을 정의하는 것입니다. 규칙을 준수하는 모든 문자열은 "일치"되는 것으로 간주됩니다.
따라서 문자열이 합법적인 이메일인지 판단하는 방법은 다음과 같습니다.
1. 이메일과 일치하는 정규식을 만듭니다.
2 정규식을 사용하여 사용자의 입력과 일치하는지 확인합니다.
정규식도 문자열로 표현되기 때문에 먼저 문자를 사용하여 문자를 설명하는 방법을 이해해야 합니다.
정규식에서는 문자를 직접 지정하면 정확히 일치합니다. d를 사용하여 숫자를 일치시키고 w를 사용하여 문자나 숫자를 일치시킵니다. 따라서:
• '00d' 는 '007'과 일치할 수 있지만 '00A'는 일치할 수 없습니다.
• 'ddd' 는 '010과 일치할 수 있습니다. ' ;
• 'wwd'는 'py3'과 일치할 수 있습니다.
.
는 모든 문자와 일치할 수 있습니다. 따라서:
• 'py.'는 'pya', 'pyb', 'py!' 등과 일치할 수 있습니다. .
가변 길이 문자를 일치시키려면 정규식에서 *를 사용하여 임의 개수의 문자(0 포함)를 나타내고, +를 사용하여 하나 이상의 문자를 나타내고, ?를 사용하여 0 또는 1자를 나타내고, {n}을 사용하여 n을 나타냅니다. n-m 문자를 나타내려면 {n,m}을 사용하세요.
복잡한 예를 살펴보겠습니다: d{3}s+d{3,8}.
왼쪽에서 오른쪽으로 해석해 보겠습니다.
1. d{3}는 '010'과 같은 3개의 숫자와 일치함을 의미합니다.
2. s 는 공백과 일치할 수 있습니다(탭 및 기타 공백 문자 포함). ), 따라서 s+는 '', '' 등과 일치하는 공백이 하나 이상 있음을 의미합니다.
3. d{3,8}은 '1234567'과 같이 3~8개의 숫자를 의미합니다.
종합해 보면 위의 정규식은 전화번호를 공백으로 구분된 지역 코드와 일치시킬 수 있습니다.
위 내용은 Python 정규식에 대한 자세한 설명, Python 정규식이 무엇인지 알려주세요.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!