Rumah  >  Artikel  >  hujung hadapan web  >  Bagaimana untuk Memadankan Aksara Beraksen dengan Ungkapan Biasa JavaScript?

Bagaimana untuk Memadankan Aksara Beraksen dengan Ungkapan Biasa JavaScript?

Barbara Streisand
Barbara Streisandasal
2024-11-08 19:47:02859semak imbas

How to Match Accented Characters with JavaScript Regular Expressions?

Ungkapan Biasa JavaScript untuk Aksara Beraksen

Latar Belakang

Walaupun ia mematuhi Unicode, JavaScript memberikan cabaran dalam memadankan aksara beraksen ("diakritik") menggunakan ungkapan biasa.

Pendekatan

Beberapa pendekatan wujud untuk menangani isu ini:

Penyenaraian Aksara Beraksen Eksplisit

Menyenaraikan semua aksara yang berkaitan secara manual adalah membosankan dan tidak praktikal.

Kelas Watak Wildcard

Menggunakan "." kelas aksara membenarkan pemadanan mana-mana aksara, tetapi berisiko padanan berlebihan.

Julat Unikod

Julat u00C0-u017F merangkumi banyak aksara bukan Latin, tetapi kekomprekanannya memerlukan pertimbangan yang teliti.

Penyelesaian Terbaik

Pendekatan yang lebih mudah ialah menggunakan kelas aksara yang dipratentukan:

[A-zÀ-ú] // accepts lowercase and uppercase accented characters

Untuk rangkaian aksen yang lebih luas, termasuk umlaut dan diakritik lain:

[A-zÀ-ÿ] 

Gotchas

Pastikan julat atau kelas aksara meliputi input yang dijangkakan, kerana tidak semua aksara beraksen disertakan dalam set ini.

Atas ialah kandungan terperinci Bagaimana untuk Memadankan Aksara Beraksen dengan Ungkapan Biasa JavaScript?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn