>  기사  >  웹 프론트엔드  >  JavaScript Regex에서 ASCII가 아닌 문자를 단어 경계와 일치시키는 방법은 무엇입니까?

JavaScript Regex에서 ASCII가 아닌 문자를 단어 경계와 일치시키는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-10-27 04:46:29552검색

How to Match Non-ASCII Characters with Word Boundaries in JavaScript Regex?

단어 경계를 사용하여 JavaScript Regex에서 비ASCII 문자 일치

JavaScript에서 단어 경계(b) 일치를 사용하는 RegExp 객체는 다음을 만날 수 있습니다. 핀란드어 모음(ä, ö 및 å)과 같은 비ASCII 문자를 처리할 때 제한 사항이 있습니다. 이러한 문자를 정확하게 일치시키려면 접근 방식을 조정해야 합니다.

다음 코드를 고려하세요.

<code class="javascript">var title = "this is simple string with finnish word tämä on ääkköstesti älkää ihmetelkö";
var searchterm = "äl";

if (new RegExp("\b" + searchterm, "gi").test(title)) {
  // This does not work for "äl"
}</code>

이 코드는 b 경계를 사용하여 제목의 "äl" 용어를 일치시키려고 시도합니다. . 그러나 b는 ASCII가 아닌 문자를 제외하고 표준 256바이트 범위를 기준으로 단어 경계와 일치하기 때문에 실패합니다.

해결책: 단어 경계가 있는 비캡처 그룹

이 문제를 해결하려면 b를 문자열의 시작 부분이나 공백과 명시적으로 일치하는 비캡처 그룹으로 바꿀 수 있습니다.

<code class="javascript">if (new RegExp("(?:^|\s)" + searchterm, "gi").test(title)) {
  // Now it works for "äl"
}</code>

분석:

  • (?:...): 비캡처 그룹
  • ^: 문자열의 시작
  • s: 공백
  • |: "or" 연산자

이 수정된 코드는 ASCII가 아닌 문자를 포함하는 보다 유연한 단어 시작 경계 조건을 정의하므로 제목의 "äl" 용어와 일치합니다.

위 내용은 JavaScript Regex에서 ASCII가 아닌 문자를 단어 경계와 일치시키는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.