>  기사  >  백엔드 개발  >  javascript - 정규식에 대한 질문

javascript - 정규식에 대한 질문

WBOY
WBOY원래의
2016-08-04 09:18:591072검색

문제: 다음 문자열이 있습니다: "python php ruby ​​​​javascript jsonp 아마도 phpisoutdated"
이 문자열의 경우 순수 정규 표현식을 사용하여 ph가 아닌 p는 포함된 모든 단어를 가져옵니다

출력 배열 [ 'python', 'javascript', 'jsonp' ]

이 문제에 대해 오랫동안 생각해 왔는데 잘 모르겠어요
제 해결책은

<code>var result = str.match(/\b\w*(?=p)\w*\b/g)
                .filter((value)=>!/.*(?=ph)/.test(value))
var result2 = str.match(  /\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g  ) 
console.log(result2)</code>

그러나 이는 순수한 규칙성 요건을 충족하지 않습니다

그룹 내 덩치 큰 남자가 이런 답을 내놨습니다

<code>/\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g </code>

완벽하게 작동합니다

하지만 이해가 안 돼요. 누군가가 이해하도록 도와줬으면 좋겠어요

답글 내용:

문제: 다음 문자열이 있습니다: "python php ruby ​​​​javascript jsonp 아마도 phpisoutdated"
이 문자열의 경우 순수 정규 표현식을 사용하여 ph가 아닌 p는 포함된 모든 단어를 가져옵니다

출력 배열 [ 'python', 'javascript', 'jsonp' ]

이 문제에 대해 오랫동안 생각해 왔는데 잘 모르겠어요
제 해결책은

<code>var result = str.match(/\b\w*(?=p)\w*\b/g)
                .filter((value)=>!/.*(?=ph)/.test(value))
var result2 = str.match(  /\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g  ) 
console.log(result2)</code>

그러나 이는 순수한 규칙성 요건을 충족하지 않습니다

그룹의 덩치가 큰 분이 이런 답변을 하셨습니다

<code>/\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g </code>

완벽하게 작동합니다

하지만 이해가 안 돼요. 누군가가 이해하도록 도와줬으면 좋겠어요

<code>var str = 'python php ruby javascript jsonp perhapsphpisoutdated';
var reg = /\b(\w*(p[^h\s](?!ph))\w*)\b/g;
str.match(reg);
// => ["python", "javascript", "perhapsphpisoutdated"]</code>
  • b은 경계문자이고, 범위는 wW 사이의 문자이다.

  • ()은 하위 표현식을 식별합니다.

  • (?!)은 역방향 예측 어설션을 식별합니다. 하위 표현식과 달리 예측 어설션은 기록되지 않습니다.

  • [^]은 조건을 충족하지 않는 집합을 식별합니다.

그래서 위의 일반적인 의미는 "p"를 포함하는 경계 사이의 문자열을 가져오지만 다음 문자열은 "h" 또는 "space"가 아니고 동시에 "ph"를 포함하지 않습니다.

b((?!ph|s).)*((p[^hs]((?!ph|s).)*)|p)b/g
b은 경계문자

각 단어에 해당하는 일치 항목은 다음과 같습니다.
((?!ph|s).)*((p[^hs]((?!ph|s).)*)|p)

이 표현을 세 부분으로 나누세요:

  1. ((?!ph|s).)*

  2. (p[^hs]((?!ph|s).)*)

  3. p

가장 많이 쓰이는 표현은 ((?!ph|s).)*입니다. 분석해 보겠습니다

.

"JavaScript에 대한 최종 가이드"에 따르면 (?!p) 너비가 0인 부정 예측 어설션 으로, 다음 문자가 p

과 일치하지 않음을 나타냅니다.

여기에서 너비가 0이라는 것은 일치하는 부분을 차지하지 않는다는 의미입니다.
이해하기 어려울 수 있습니다. 예를 들면 다음과 같습니다.

"1234".match(/((?!34).)*/)

의 값을 계산합니다.
  1. 처음에는 (?!34) 앞에 아무것도 없고 무시하고 .만 일치하고 "1"과 일치하고 나머지 문자열은 "234"

  2. 입니다.
  3. "234"과 일치하고 "23"?!과 일치하는지 테스트합니다. 계속해서 "34"이 일치하지 않습니다. >,"23". "2"

  4. 과 일치합니다.
  5. 과 일치하므로 "34""34" 일치가 종료됩니다. ?! "34"

    전체 표현식의 일치 결과는

입니다. "12"결론: 형식의 표현식과 일치하는 문자열은

앞부분입니다. /((?!p).)*/여기서 이전 세 가지 표현을 살펴보겠습니다. p

  1. ((?!ph|s).)*

  2. (p[^hs]((?!ph|s).)*)

  3. p

  4. 첫 번째 표현은
앞의 가능한 가장 긴 문자
  • 또는 단어의 공백과 일치하는 것을 의미합니다.

    "ph"두 번째 표현식은

    이후의 문자와 일치합니다.
  • 뒤의 첫 번째 문자는
  • 일 수 없으며,

    "p" "p""h" 세 번째 표현식은 단일 "ph" 문자와 일치합니다. 이전 일치에서 가장 짧은 일치 형식은

    (최소 2자)이고 포스터에는 단일 "p" 문자가 필요하기 때문입니다. 하지만 포함되지 않으므로
  • 단독으로 일치합니다.

    "p"정리해 보면 위의 세 가지 일치 표현 중 p[^hs]과 일치하는 것이 하나도 없지만, 그 중에는 질문

    의 요구 사항을 완전히 충족하는
  • 이 있어야 합니다.
성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.