문자열에서 악센트가 있는 모든 문자를 효율적으로 바꾸시겠습니까?
저는1 찾고 있습니다. JavaScript 클래스의 문자열 비교 기능을 개선합니다.
현재 string.replace()를 사용하여 전역(g) 검색을 수행하고 문자열(p{InCombiningDiaticalMarks})의 모든 악센트 부호 문자를 기본 형식(NFD를 사용한 정규 분해)으로 바꿉니다.
입력 문자열 검색 악센트가 있는 문자가 몇 개 있어도 상당히 광범위한 변동이 발생하며 더 큰 입력을 검색할 때 성능이 느려질 수 있습니다.
이를 수행하는 더 효율적인 방법이 있습니까?
[1] 편집 - 일반적인 문제를 명확하게 합니다.
이 작업은 악센트가 있는 독일어 문자를 악센트가 없는 형식으로 변환하기 위해 수행됩니다. , "잘못된" 순서로 문자열을 정렬할 때(예: 움라우트가 움라우트가 아닌 "a"보다 먼저 끝나는 경우) 다음에서 올바르게 정렬될 수 있습니다. 현지 기대에 부응합니다.
따라서 단순히 악센트가 있는 문자를 검색하여 악센트가 없는 문자로 바꾸는 것은 적절하지 않습니다. 악센트가 있는 형식을 해당 기본 문자로 바꾸는 것이 필요합니다. 동등합니다.
정규화가 없거나 부정확하면 정렬이 잘못될 수 있습니다. order.
[편집 2]
가난한 사람이 클라이언트 측에서 near-collation-corright 정렬을 구현하려면 JavaScript가 필요합니다. 문자열에서 단일 문자를 효율적으로 대체하는 함수입니다.
여기 내 말은 이것이다(이것은 독일어 텍스트에 적용되며 다른 언어는 다르게 정렬된다는 점에 유의하세요):
native sorting gets it wrong: a b c o u z ä ö ü collation-correct would be: a ä b c o ö u ü z
기본적으로 주어진 문자열에서 "ä"가 나오는 모든 항목을 "a"로 바꿔야 합니다. 에). 이렇게 하면 기본 정렬 결과가 사용자가 기대하는 결과(또는 데이터베이스가 반환하는 결과)와 매우 유사해집니다.
다른 언어에도 이를 수행할 수 있는 기능이 있습니다. Python에서는 str.translate()를 제공합니다. Perl에는 tr/…/…/가 있고, XPath에는 번역() 함수가 있고, ColdFusion에는 바꾸기 목록()이 있습니다. 그런데 JavaScript는 어떻습니까?
지금 제가 가지고 있는 것은 다음과 같습니다.
// s would be a rather short string (something like // 200 characters at max, most of the time much less) function makeSortString(s) { var translate = { "ä": "a", "ö": "o", "ü": "u", "Ä": "A", "Ö": "O", "Ü": "U" // probably more to come }; var translate_re = /[öäüÖÄÜ]/g; return ( s.replace(translate_re, function(match) { return translate[match]; }) ); }
우선 함수를 호출할 때마다 정규 표현식이 다시 작성된다는 사실이 마음에 들지 않습니다. 이런 점에서 클로저가 도움이 될 수 있을 것 같은데 왠지 잘 잡히지 않는 것 같아요.
좀 더 효율적인 방법이 있을까요?
위 내용은 향상된 정렬을 위해 JavaScript 문자열에서 악센트 문자를 효율적으로 바꾸는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!