Rumah >hujung hadapan web >tutorial js >Bagaimana untuk Menggantikan Aksara Beraksen dengan Cekap dalam Rentetan JavaScript untuk Isih Yang Diperbaiki?
Menggantikan semua aksara aksen dalam rentetan dengan cekap?
Saya1 sedang mencari meningkatkan fungsi perbandingan rentetan dalam kelas JavaScript saya.
Pada masa ini mereka menggunakan string.replace() untuk melakukan carian global (g) dan menggantikan semua aksara beraksen dalam rentetan (p{InCombiningDiacriticalMarks} ) dengan bentuk asasnya (penguraian kanonik menggunakan NFD).
Mencari rentetan input untuk genap beberapa aksara beraksen menghasilkan churn yang cukup luas - dan apabila mencari input yang lebih besar, prestasi boleh menjadi lembap.
Adakah terdapat cara yang lebih berkesan untuk melakukannya?
[1] Edit - Menjelaskan isu umum.
Operasi ini sedang dilakukan untuk menukar aksara Jerman beraksen kepada bentuk tanpa aksen, supaya apabila menyusun rentetan dalam susunan "salah" (cth. umlaut berakhir sebelum bukan umlaut "a"), ia boleh diisih dengan betul mengikut jangkaan tempatan.
Oleh itu adalah tidak memadai untuk mencari aksara beraksen dan menggantikannya dengan setara tanpa aksen - adalah perlu untuk menggantikan bentuk beraksen dengan asas mereka setara.
Penormalan yang tidak atau salah boleh mengakibatkan tertib isihan yang salah.[Edit 2]
Untuk pelaksanaanberhampiran-pengumpulan-pengisihan yang betul pada bahagian klien Saya memerlukan fungsi JavaScript yang berfungsi cekap penggantian aksara tunggal dalam rentetan.
Inilah yang saya maksudkan (perhatikan bahawa ini terpakai pada teks Jerman, bahasa lain disusun secara berbeza):native sorting gets it wrong: a b c o u z ä ö ü collation-correct would be: a ä b c o ö u ü zPada asasnya , saya memerlukan semua kejadian "ä" rentetan yang diberikan digantikan dengan "a" (dan seterusnya). Dengan cara ini hasil pengisihan asli akan menjadi sangat hampir dengan apa yang pengguna jangkakan (atau apa yang akan dikembalikan oleh pangkalan data).Bahasa lain mempunyai kemudahan untuk melakukannya: Python membekalkan str.translate(), dalam Perl terdapat tr/…/…/, XPath mempunyai fungsi translate(), ColdFusion mempunyai ReplaceList(). Tetapi bagaimana dengan JavaScript?Inilah yang saya ada sekarang.
// s would be a rather short string (something like // 200 characters at max, most of the time much less) function makeSortString(s) { var translate = { "ä": "a", "ö": "o", "ü": "u", "Ä": "A", "Ö": "O", "Ü": "U" // probably more to come }; var translate_re = /[öäüÖÄÜ]/g; return ( s.replace(translate_re, function(match) { return translate[match]; }) ); }Sebagai permulaan, saya tidak suka fakta bahawa regex dibina semula setiap kali saya memanggil fungsi tersebut. Saya rasa penutupan boleh membantu dalam hal ini, tetapi saya nampaknya tidak memahaminya atas sebab tertentu.Bolehkah seseorang memikirkan sesuatu yang lebih cekap?
Atas ialah kandungan terperinci Bagaimana untuk Menggantikan Aksara Beraksen dengan Cekap dalam Rentetan JavaScript untuk Isih Yang Diperbaiki?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!