>웹 프론트엔드 >JS 튜토리얼 >향상된 정렬을 위해 JavaScript 문자열에서 악센트 문자를 효율적으로 바꾸는 방법은 무엇입니까?

향상된 정렬을 위해 JavaScript 문자열에서 악센트 문자를 효율적으로 바꾸는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-30 10:43:21412검색

How to Efficiently Replace Accented Characters in a JavaScript String for Improved Sorting?

문자열에서 악센트가 있는 모든 문자를 효율적으로 바꾸시겠습니까?

저는1 찾고 있습니다. JavaScript 클래스의 문자열 비교 기능을 개선합니다.

현재 string.replace()를 사용하여 전역(g) 검색을 수행하고 문자열(p{InCombiningDiaticalMarks})의 모든 악센트 부호 문자를 기본 형식(NFD를 사용한 정규 분해)으로 바꿉니다.

입력 문자열 검색 악센트가 있는 문자가 몇 개 있어도 상당히 광범위한 변동이 발생하며 더 큰 입력을 검색할 때 성능이 느려질 수 있습니다.

이를 수행하는 더 효율적인 방법이 있습니까?

[1] 편집 - 일반적인 문제를 명확하게 합니다.

이 작업은 악센트가 있는 독일어 문자를 악센트가 없는 형식으로 변환하기 위해 수행됩니다. , "잘못된" 순서로 문자열을 정렬할 때(예: 움라우트가 움라우트가 아닌 "a"보다 먼저 끝나는 경우) 다음에서 올바르게 정렬될 수 있습니다. 현지 기대에 부응합니다.

따라서 단순히 악센트가 있는 문자를 검색하여 악센트가 없는 문자로 바꾸는 것은 적절하지 않습니다. 악센트가 있는 형식을 해당 기본 문자로 바꾸는 것이 필요합니다. 동등합니다.

정규화가 없거나 부정확하면 정렬이 잘못될 수 있습니다. order.

[편집 2]

가난한 사람이 클라이언트 측에서 near-collation-corright 정렬을 구현하려면 JavaScript가 필요합니다. 문자열에서 단일 문자를 효율적으로 대체하는 함수입니다.

여기 내 말은 이것이다(이것은 독일어 텍스트에 적용되며 다른 언어는 다르게 정렬된다는 점에 유의하세요):

native sorting gets it wrong: a b c o u z ä ö ü
collation-correct would be:   a ä b c o ö u ü z

기본적으로 주어진 문자열에서 "ä"가 나오는 모든 항목을 "a"로 바꿔야 합니다. 에). 이렇게 하면 기본 정렬 결과가 사용자가 기대하는 결과(또는 데이터베이스가 반환하는 결과)와 매우 유사해집니다.

다른 언어에도 이를 수행할 수 있는 기능이 있습니다. Python에서는 str.translate()를 제공합니다. Perl에는 tr/…/…/가 있고, XPath에는 번역() 함수가 있고, ColdFusion에는 바꾸기 목록()이 있습니다. 그런데 JavaScript는 어떻습니까?

지금 제가 가지고 있는 것은 다음과 같습니다.

// s would be a rather short string (something like 
// 200 characters at max, most of the time much less)
function makeSortString(s) {
  var translate = {
    "ä": "a", "ö": "o", "ü": "u",
    "Ä": "A", "Ö": "O", "Ü": "U"   // probably more to come
  };
  var translate_re = /[öäüÖÄÜ]/g;
  return ( s.replace(translate_re, function(match) { 
    return translate[match]; 
  }) );
}

우선 함수를 호출할 때마다 정규 표현식이 다시 작성된다는 사실이 마음에 들지 않습니다. 이런 점에서 클로저가 도움이 될 수 있을 것 같은데 왠지 잘 잡히지 않는 것 같아요.

좀 더 효율적인 방법이 있을까요?


  1. 1

위 내용은 향상된 정렬을 위해 JavaScript 문자열에서 악센트 문자를 효율적으로 바꾸는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.