>  기사  >  웹 프론트엔드  >  JavaScript 한 줄 모드_정규식

JavaScript 한 줄 모드_정규식

微波
微波원래의
2017-06-28 13:39:131162검색

이 글에서는 한 줄 모드도 있는 JavaScript의 정규 표현식을 주로 소개합니다. 필요한 친구들이 참고하면 됩니다.

정규 표현식은 1970년 Ken Thompson이 개선한 QED Editor에서 처음 구현했습니다. 당시 정규 표현식 "."에서 개행 문자를 제외한 모든 문자와 일치했습니다:

"."는 5563c1593a3ac6eb1677af49676ec1ed을 제외한 모든 문자와 일치하는 정규 표현식입니다.

위 문장은 QED의 1970년 공식 문서로, 역사상 최초의 정규 문서가 될 수 있습니다.

왜 그런 규칙이 있는 걸까요? QED는 라인 단위로 파일을 편집하는데, 라인 끝의 줄 바꿈 문자도 이 라인의 내용에 포함되기 때문입니다. 예를 들어, 코드 조각에서 모든 한 줄 주석을 삭제하려면 QED에서 다음 명령을 사용할 수 있습니다.

1,$s#//.*##

"."가 개행 문자와 일치할 수 있으면 개행 문자도 삭제됩니다. 이로 인해 이러한 줄이 발생하고 다음 줄이 병합되는데 이는 일반적으로 우리가 원하는 것이 아니므로 "."는 처음 발명되었을 때 개행 문자와 일치하지 않도록 설계되었습니다. 현재 운영 체제에는 테스트할 QED 명령이 없지만 여전히 VIM이 있으며 같은 이유로 VIM의 "."는 줄 바꿈 문자와 일치할 수 없습니다.

Node와 달리 파일 읽기는 일반적으로 한 번에 전체 파일을 읽습니다. Perl은 다음과 같이 파일을 한 줄씩 읽는 많은 Linux 명령의 전통을 계승합니다.

while (a8093152e673feb7aba1828c43532094) {print $_}

_에도 끝에 개행 문자가 있습니다. 그래서 Perl "."이 개행 문자와 일치하지 않는다는 QED의 규칙을 상속받는 것도 당연합니다. 하지만 Perl은 결국 프로그래밍 언어이며 정규식이 일치해야 하는 개체는 한 줄의 텍스트일 뿐만 아니라 여러 줄의 텍스트일 수도 있습니다. ."에는 교차 라인 일치가 있습니다. 따라서 Perl은 "."가 개행 문자와도 일치할 수 있도록 하는 일반 단일 행 모드 /s를 발명했습니다.

Perl에서 한 줄 모드를 켜는 데 사용되는 /s 수정자에 대한 공식 설명은 "문자열을 한 줄로 처리"입니다. 이 "한 줄"은 다음과 같이 이해해야 합니다. "." 한 줄 모드가 아닌 일반 모드에서 Perl은 여러 줄 문자열을 한 줄로 처리하고 개행 문자를 인라인 문자로 처리하므로 "."이 일치할 수 있습니다. 좀 더 명확하게 말하면, 다음 세 줄의 텍스트

1
2
3

는 "1n2n3n" 한 줄의 텍스트로 간주됩니다. 이것이 바로 한 줄 모드를 의미합니다.

하지만 끔찍한 점은 같은 이유로(문자열 변수에 여러 줄의 텍스트가 포함될 수 있음) Perl도 여러 줄 모드인 /m 수정자를 발명했다는 것입니다. 공식적인 설명은 "문자열을 여러 줄로 처리"입니다. 이 모드 JavaScript 일반 규칙은 고대부터 존재했습니다. 여기서 "여러 줄"의 의미는 기본적으로 ^ 및 $ 메타 문자가 문자열 중간에 있는 개행 문자 앞과 뒤의 위치와 일치하지 않는다는 것입니다. , 문자열에는 항상 한 줄만 있고 여러 줄이 열리는 것으로 간주됩니다.

즉, 한 줄 모드와 여러 줄 모드는 서로 다른 메타 문자를 위한 것입니다. 정규식을 처음 접하는 사람들은 "한 줄 모드"와 "다중 줄 모드"로 혼동할 것 같습니다. 대응하지만 실제로는 전혀 관련이 없는 명사로 인해 혼동됩니다.

나중에 Ruby의 작성자는 "한 줄 모드"라는 정규 용어가 잘 사용되지 않는다고 느꼈을 수도 있으므로 줄 바꿈 문자와 일치하는 "."의 모드를 "다중 줄 모드", 즉 . * 등 정규식은 여러 줄을 일치시킬 수 있으므로 수정자도 /m을 사용합니다(Ruby는 기본적으로 Perl에서 "여러 줄 모드"를 활성화하므로 /m은 실제로 추가되지 않습니다). 부상을 모욕하고 더욱 혼란스럽게 만듭니다.

나중에 Python 작성자도 "한 줄 모드"라는 용어를 피해야 한다고 느낄 수도 있으므로 도트가 모든 문자와 일치할 수 있다는 의미로 "dotall"이라는 새 이름을 붙였습니다. 이상 Java 이 이름도 사용되었습니다.

위에서는 역사를 검토하고 단선 모드의 유래에 대해 설명했으며 단선 모드의 이름이 잘 선택되지 않았다는 점을 설명했습니다. V8은 최근 3단계 ES 제안(https://github.com/mathiasbynens/es-regexp-dotall-flag)을 구현했습니다. 이 제안은 JavaScript 규칙성을 위해 /s 수정자와 dotAll 속성을 도입합니다. dotAll 속성은 Python을 학습한 후입니다. Java에서는 /s 수정자가 Perl에서 상속되었습니다. 여기서는 /d와 같은 새로운 수정자를 만들 필요가 없으며 이로 인해 상황이 더 복잡해집니다. JavaScript에서 /s의 구체적인 효과는 "."이 이전에 일치할 수 없었던 4개의 줄 종결자(n(줄 바꿈), r(캐리지 리턴), u2028(줄 구분 기호), u2029(단락 구분 기호))과 일치하도록 허용하는 것입니다.

/foo/s.dotAll // true
/^.{4}$/s.test("\n\r\u2028\u2029") // true

는 실제로 매우 간단한 것이지만 JavaScript 이외의 정규 표현식을 접해본 적이 없는 일부 학생들은 이 새로운 모드를 배울 때 혼란스러울 수 있습니다. 다시 한 번 분명히 말씀드리자면 여러 줄 모드 제어 ^ 및 $ 성능, 한 줄 모드는 "."의 성능을 제어하며 둘 사이에는 직접적인 관계가 없습니다.

그러나 원래 한 줄 모드와 여러 줄 모드라는 혼란스러운 개념을 도입한 Perl 언어는 Perl 6에서 이 두 가지 모드를 완전히 삭제했습니다. "."는 기본적으로 줄바꿈 문자와 일치하며 N은 줄바꿈을 제외한 모든 것과 일치할 수 있습니다. 모든 문자 ^ 및 $는 항상 문자열의 시작과 끝과 일치하며, 두 개의 새로운 메타 문자 ^ 및 $$는 줄의 시작과 끝과 일치합니다.

과거에 사용했던 한 줄 모드 [^] 또는 [sS]에 대한 대안이 완전히 쓸모가 있는 것은 아닙니다. 예를 들어 JavaScript 규칙성을 사용하는 일부 편집기(VS Code, Atom)에서는 다음을 수행할 가능성이 없습니다. 단일 라인 모드 인터페이스를 활성화합니다. 그러나 편집기의 일반 기능에 대해 말하면 JavaScript로 구현된 편집기의 일반 기능은 여전히 ​​너무 약합니다. 예를 들어 Sublime에 있는 경우 특정 모드를 켤 수 없습니다. Python 일반 코드), 일반 코드 내에서 (?s)를 사용하여 도트 모드를 활성화합니다. 예를 들어 (?s)/*.+?*/를 사용하면 모든 여러 줄 주석과 일치시킬 수 있습니다.

위 내용은 JavaScript 한 줄 모드_정규식의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.