>  기사  >  웹 프론트엔드  >  JavaScript 정규식에는 한 줄 모드도 있습니다

JavaScript 정규식에는 한 줄 모드도 있습니다

小云云
小云云원래의
2017-12-09 11:27:571087검색

이 글은 주로 일반 JavaScript와 한줄 모드를 소개합니다. 필요한 친구들이 참고하면 도움이 될 것입니다.

정규식은 1970년 Ken Thompson이 개선한 QED 편집기에서 처음 구현했습니다. 당시 정규식에서 가장 간단한 메타 문자 "."는 줄 바꿈을 제외한 모든 문자와 일치했습니다.

"." 5563c1593a3ac6eb1677af49676ec1ed.

위 문장은 역사상 최초의 정규 문서라 할 수 있는 1970년 QED 공식 문서에서 따온 것입니다.

왜 그런 규칙이 있는 걸까요? QED는 파일을 라인 단위로 편집하는데, 라인 끝의 줄 바꿈 문자도 이 라인의 내용에 포함되기 때문입니다. 예를 들어, 코드 조각에서 모든 한 줄 주석을 삭제하려면 QED에서 다음 명령을 사용할 수 있습니다.

1,$s#//.*##

"."이 개행 문자와 일치할 수 있으면 개행 문자가 삭제됩니다. 이 줄은 일반적으로 우리가 원하는 것이 아닌 다음 줄과 병합됩니다. 따라서 "."은 원래 개발되었을 때 개행 문자와 일치하지 않도록 설계되었습니다. 현재 운영 체제에는 테스트할 QED 명령이 없지만 여전히 VIM이 있으며 같은 이유로 VIM의 "."는 줄 바꿈 문자와 일치할 수 없습니다.

파일을 읽으면 일반적으로 전체 파일을 한 번에 읽는 Node와 달리 Perl은 다음과 같이 파일을 한 줄씩 읽는 많은 Linux 명령의 전통을 이어받습니다.

while (a8093152e673feb7aba1828c43532094) {print $_}

_ 개행 문자도 있습니다 결국 Perl은 "."이 개행 문자와 일치하지 않는다는 QED의 규칙을 자연스럽게 상속합니다. 그러나 Perl은 결국 프로그래밍 언어이지 편집기가 아닙니다. 정규식이 일치해야 하는 개체는 한 줄의 텍스트일 뿐만 아니라 여러 줄의 텍스트일 수도 있습니다. 따라서 Perl은 "."도 개행 문자와 일치시킬 수 있는 일반 단일 행 모드 /s를 발명했습니다.

Perl에서 한 줄 모드를 켜는 데 사용되는 /s 수정자에 대한 공식 설명은 "문자열을 한 줄로 처리"입니다. 이 "한 줄"은 다음과 같이 이해해야 합니다. "." 한 줄 모드가 아닌 일반 모드에서 Perl은 여러 줄 문자열을 한 줄로 처리하고 개행 문자를 인라인 문자로 처리하므로 "."이 일치할 수 있습니다. 좀 더 생생하게 말하면, 다음 세 줄의 텍스트

1
2
3

는 "1n2n3n" 한 줄의 텍스트로 간주됩니다. 이것이 바로 한 줄 모드를 의미합니다.

하지만 끔찍한 점은 같은 이유로(문자열 변수에 여러 줄의 텍스트가 포함될 수 있음) Perl도 여러 줄 모드인 /m 수정자를 발명했다는 것입니다. 공식 설명은 "문자열을 여러 줄로 처리합니다. ". 이 모드 JavaScript 일반 규칙은 고대부터 존재했습니다. 여기서 "여러 줄"의 의미는 기본적으로 ^ 및 $ 메타 문자가 문자열 중간에 있는 개행 문자 앞뒤의 위치와 일치하지 않는다는 것입니다. 즉, 문자열에는 항상 한 줄만 있고 여러 줄이 열리는 것으로 간주됩니다.

즉, 한 줄 모드와 여러 줄 모드는 서로 다른 메타 문자를 위한 것입니다. 정규식을 처음 접하는 사람들은 "한 줄 모드"와 "다중 줄 모드"로 혼동할 것 같습니다. 대응하지만 실제로는 전혀 관련이 없는 명사로 인해 혼동됩니다.

나중에 Ruby의 작성자는 "한 줄 모드"라는 정규 용어가 잘 사용되지 않는다고 느꼈을 수도 있으므로 줄 바꿈 문자와 일치하는 "."의 모드를 "다중 줄 모드", 즉 . * 등 정규식은 여러 줄을 일치시킬 수 있으므로 수정자도 /m을 사용합니다(Ruby는 기본적으로 Perl에서 "여러 줄 모드"를 활성화하므로 /m은 실제로 추가되지 않습니다). 부상을 모욕하고 더욱 혼란스럽게 만듭니다.

나중에 Python 작성자도 "한 줄 모드"라는 용어를 피해야 한다고 느낄 수도 있으므로 도트가 모든 문자와 일치할 수 있다는 의미로 "dotall"이라는 새 이름을 붙였습니다. 이상 Java 이 이름도 사용되었습니다.

위에서는 역사를 검토하고 단선 모드의 유래에 대해 설명했으며 단선 모드의 이름이 잘 선택되지 않았다는 점을 설명했습니다. V8은 최근 3단계 ES 제안(https://github.com/mathiasbynens/es-regexp-dotall-flag)을 구현했습니다. 이 제안은 Python 및 Java에서 dotAll 속성을 학습하기 위해 /s 수정자와 dotAll 속성을 도입합니다. , /s 수정자는 Perl에서 상속되었습니다. 여기서는 /d와 같은 새로운 수정자를 만들 필요가 없습니다. 이는 상황을 더 복잡하게 만들 뿐입니다. JavaScript에서 /s의 구체적인 효과는 "."이 이전에 일치할 수 없었던 4개의 줄 종결자(n(줄 바꿈), r(캐리지 리턴), u2028(줄 구분 기호), u2029(단락 구분 기호))과 일치하도록 허용하는 것입니다.

/foo/s.dotAll // true
/^.{4}$/s.test("\n\r\u2028\u2029") // true

사실 아주 간단한 일이지만 JavaScript 이외의 정규식을 접해본 적이 없는 학생들은 이 새로운 모드를 배울 때 혼란스러워할 수도 있습니다. 라인 모드 제어 ^ 및 $의 성능은 단일 라인 모드는 "."의 성능을 제어하며 둘 사이에는 직접적인 관계가 없습니다.

그러나 원래 한 줄 모드와 여러 줄 모드라는 혼란스러운 개념을 도입한 Perl 언어는 Perl 6에서 이 두 가지 모드를 완전히 삭제했습니다. "."는 기본적으로 줄바꿈 문자와 일치하며 N은 줄바꿈을 제외한 모든 것과 일치할 수 있습니다. 모든 문자 ^ 및 $는 항상 문자열의 시작과 끝과 일치하며, 두 개의 새로운 메타 문자 ^ 및 $$는 줄의 시작과 끝과 일치합니다.

과거에 사용했던 한 줄 모드 [^] 또는 [sS]에 대한 대안이 완전히 쓸모가 있는 것은 아닙니다. 예를 들어 JavaScript 규칙성을 사용하는 일부 편집기(VS Code, Atom)에서는 다음을 수행할 가능성이 없습니다. 단일 라인 모드 인터페이스를 활성화합니다. 그러나 편집기의 일반 기능에 대해 말하면 JavaScript로 구현된 편집기의 일반 기능은 여전히 ​​너무 약합니다. 예를 들어 Sublime에 있는 경우 특정 모드를 켤 수 없습니다. Python 일반 코드), 일반 코드 내에서 (?s)를 사용하여 도트 모드를 활성화합니다. 예를 들어 (?s)/*.+?*/를 사용하면 모든 여러 줄 주석과 일치시킬 수 있습니다. ,

관련 권장사항:

검색 키워드 강조 표시를 구현하기 위한 JavaScript 정규 메소드 대체_정규 표현식

JavaScript에서 정규 표현식의 개념 및 적용_정규 표현식

JavaScript 정규 표현식 응용 프로그램

위 내용은 JavaScript 정규식에는 한 줄 모드도 있습니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.