>  기사  >  백엔드 개발  >  정규식에 대한 개인적인 이해 - 게으른 일치

정규식에 대한 개인적인 이해 - 게으른 일치

WBOY
WBOY원래의
2016-08-08 09:33:021011검색

문제 설명

이 기사 링크: http://www.hcoding.com/?p=130

처음 정규식을 배울 때 궁금한 점이 있습니다. 예를 들어 처음 학습을 시작했을 때 문자열 "_abc_123_"에서 첫 번째 쌍의 문자를 일치시켜야 합니다. 정규 표현식에서는 "/_w*_/"라고 쓰면 일치하는 결과는 "abc" 대신 "abc_123"입니다. 물음표 "/_w*?_/"이면 일치하는 결과는 "abc"입니다.

우리는 알고 있다? ' 단독으로 사용하면 0번 또는 1번 반복하고, '? '은 반복 한정자 뒤에 나오며, 그 기능은 게으른 일치, 즉 가능한 한 적은 수의 문자를 일치시키는 것입니다. 게으른 한정자 설명:

  • *?: 원하는 만큼 반복하세요. 가능하면 적게 반복하세요.
  • +?: 1회 이상 반복, 최대한 적게 반복
  • ??: 0~1회 반복, 최대한 적게 반복
  • {n,m}?: n ~ m번 반복합니다. 그러나 가능한 한 적게 반복합니다
  • {n,}?: n회 이상 반복, 가능하면 적게 반복

예, "가능한 적은 반복"입니다. 이것은 게으른 일치에 대한 투박하고 직접적인 설명입니다.

그렇다면 '가능한 한 적은 반복'을 어떻게 이해하나요? 정규식의 무시된 우선순위 수량자에서 이를 설명할 수 있습니다.

우선순위 수량자 무시

수량자 "*?", "+?", "??", "{n,m}?", "{n,}?"는 모두 무시된 우선순위 수량자입니다. , +, *, {} ​​뒤에 ?를 추가하는 것으로 구성됩니다. 우선순위 무시는 일치 시 먼저 무시를 시도합니다. 예를 들어 `ab??`가 "abb"와 일치하면 "ab" 대신 "a"를 가져옵니다. 엔진이 a와 성공적으로 일치하면 우선순위를 무시하기 때문에 먼저 b와 일치하지 않도록 선택하고 계속해서 표현식을 확인하여 표현식이 종료되었음을 발견하면 엔진은 일치가 성공했음을 직접 보고합니다. 특히 다음 예를 사용하여 우선순위 수량자를 무시하는 작동 원리를 단계별로 설명합니다.

위의 예에서도 "/_w*?_/"를 사용하여 "_abc_123_"에서 첫 번째 "_" 쌍 사이의 문자를 일치시킵니다.

첫 번째 '_' 일치를 시작한 후 'w*?'는 우선순위 수량자를 무시하므로 먼저 어떤 문자와도 일치할 필요가 없다고 결정합니다. _/'의 두 번째 '_'('w*?' 뒤의 '_')는 대상 문자열 '_abc_123_'의 'a'와 일치합니다. , 일치가 실패하면 'w*?'가 일치하지 않는 분기를 시도하는 데 사용됩니다(w를 사용하여 a를 일치시키려면 a를 성공적으로 일치시키십시오)

다음 단계는 일치를 시도해야 할까요, 아니면 무시해야 할까요? 'w*?'는 우선순위 수량자를 무시하고 이를 무시하기로 선택하므로 '_'는 b와 일치하지 않고 'w*?'는 위의 단계를 반복한 후 일치하지 않습니다. 3회('w*?' 표현식 뒤의 '_'가 대상 문자열의 두 번째 '_'와 일치할 때까지) 'abc'가 최종적으로 일치됩니다.

프로세스(첫 번째 '_' 일치 시작 후):

    /_w*?
  • _/' 표현식의 두 번째 '_'과 대상 문자열 '_abc_123_'의 'a가 일치합니다. 일치가 실패했습니다. 'w*?'가 대상 문자열 '_abc_123_'의 'a'를 일치시키려고 시도했지만 일치가 성공했습니다.
  • expression/_w*?
  • _/'의 두 번째 '_'과 대상 문자열 '_abc_123_'의 'b가 일치합니다. 일치가 실패했습니다. 'w*?'는 대상 문자열 '_abc_123_'에서 'ab'를 일치시키려고 시도했지만 일치가 성공했습니다. /_w*?
  • _
  • /' 표현식의 두 번째 '_'과 대상 문자열 '_abc_123_'의 'c가 일치합니다. 일치 실패, 'w*?'가 대상 문자열 '_abc_123_'에서 'abc'를 일치시키려고 시도했지만 일치가 성공했습니다. 표현식 /_w*?_
  • /'의 두 번째 '
  • _' 및 대상 문자열 '_abc_123_'의 '_ 일치, 일치 성공하면 경기가 종료됩니다. 결과는 ABC입니다. 위 내용은 "정규식 익히기"에서 우선순위 한정사 무시에 대한 섹션을 읽은 후 내 생각입니다. 제가 틀렸다면 겸허히 여러분의 조언을 받아들이겠습니다.

이 기사 링크: http://www.hcoding.com/?p=130

원본 기사 표시: JC&hcoding.com

위 내용은 정규식(게으른 일치)에 대한 개인적인 이해를 소개하며, PHP 튜토리얼에 관심이 있는 친구들에게 도움이 되기를 바랍니다.

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.