cari
RumahJavajavaTutorialBagaimana untuk Mengeluarkan Tanda Diakritik daripada Rentetan Unicode di Java?

How to Remove Diacritical Marks from Unicode Strings in Java?

Mengalih keluar Tanda Diakritik daripada Aksara Unikod

Tanda diakritik, seperti tilde, umlaut dan circumflex, boleh mengubah suai sebutan dan ejaan aksara . Untuk memudahkan carian dan perbandingan, tanda ini mungkin perlu dibuang. Begini cara untuk mengalih keluar tanda diakritik daripada aksara Unikod dalam Java:

Menggunakan Borang Normalisasi NFD dan Ungkapan Biasa

Kaedah normalize(Normalizer.Form.NFD) menguraikan Unicode rentetan ke dalam aksara asasnya dan tanda diakritik. Dengan menggabungkan ini dengan ungkapan biasa yang sepadan dengan tanda diakritikal, anda boleh mengeluarkannya daripada rentetan.

import java.util.regex.Pattern;

public class DiacriticRemover {
    public static final Pattern DIACRITICS_PATTERN = Pattern.compile("[\p{InCombiningDiacriticalMarks}]");

    public static String removeDiacritics(String str) {
        return DIACRITICS_PATTERN.matcher(str).replaceAll("");
    }
}

Penggunaan Contoh:

String withDiacritics = "Björń";
String withoutDiacritics = DiacriticRemover.removeDiacritics(withDiacritics);
System.out.println(withoutDiacritics); // Output: Bjorn

Penyederhanaan Rentetan Dipertingkat

Untuk mengendalikan aksara khas bukan diakritik yang boleh menjejaskan carian dan perbandingan, pertimbangkan untuk menggunakan ImmutableMap Google dan pusingan pembersihan tambahan.

import com.google.common.collect.ImmutableMap;

public class StringSimplifier {
    private static final ImmutableMap<string string> NONDIACRITICS = ImmutableMap.<string string>builder()
            // ... (define replacements here)
            .build();

    public static String simplifiedString(String str) {
        return NONDIACRITICS.entrySet().stream()
                .reduce(str, (s, entry) -> s.replaceAll(entry.getKey(), entry.getValue()), String::concat);
    }
}</string></string>

Penggunaan Contoh:

String withNonDiacritics = "Białystok";
String simplified = StringSimplifier.simplifiedString(withNonDiacritics);
System.out.println(simplified); // Output: Bialystok

Dengan menggunakan teknik ini, anda boleh mengalih keluar tanda diakritik dan permudahkan rentetan untuk keupayaan carian dan perbandingan yang dipertingkatkan.

Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Tanda Diakritik daripada Rentetan Unicode di Java?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Kerugian data cache Java: Mengapa data tidak dapat diambil dari cache?Kerugian data cache Java: Mengapa data tidak dapat diambil dari cache?Apr 19, 2025 pm 02:57 PM

Penyelesaian Analisis dan Pengoptimuman Sebab mengapa data cache Java tidak dapat diperolehi dalam projek Java, adalah perkara biasa untuk cache sejumlah besar data ke dalam ingatan untuk akses cepat ...

Sekiranya anda ingin menjadi pemaju Java yang lebih baik, apakah aspek JVM yang paling bernilai melabur?
atau
Java Advanced: Penyelidikan mendalam mengenai JVM, yang mana mekanisme teras paling bernilai diterokai?Sekiranya anda ingin menjadi pemaju Java yang lebih baik, apakah aspek JVM yang paling bernilai melabur? atau Java Advanced: Penyelidikan mendalam mengenai JVM, yang mana mekanisme teras paling bernilai diterokai?Apr 19, 2025 pm 02:54 PM

Java mendalam: Dunia mesin maya yang patut diterokai. Ramai pemaju Java berharap dapat meningkatkan teknologi mereka selepas menguasai sintaks asas dan rangka kerja yang biasa digunakan ...

Bagaimana untuk menyelesaikan masalah penindasan data dan kehilangan gaya sel -sel yang digabungkan apabila memupuk templat Excel dengan EasyExcel?Bagaimana untuk menyelesaikan masalah penindasan data dan kehilangan gaya sel -sel yang digabungkan apabila memupuk templat Excel dengan EasyExcel?Apr 19, 2025 pm 02:51 PM

Soalan yang sering ditanya semasa mengisi sel -sel yang digabungkan dengan easyexcel ...

Bagaimana untuk menyelesaikan pemetaan medan dalam sistem dok melalui alat Mapstruct?Bagaimana untuk menyelesaikan pemetaan medan dalam sistem dok melalui alat Mapstruct?Apr 19, 2025 pm 02:48 PM

Cabaran pemetaan medan dan penyelesaian dalam dok sistem. Semasa proses dok sistem, anda sering memenuhi keperluan untuk memetakan bidang antara satu sistem ke satu sama lain ...

Bagaimana untuk menyelesaikan pengecualian 'PSQLException: Ralat: Membatalkan pernyataan kerana permintaan pengguna' dalam aplikasi Springboot?Bagaimana untuk menyelesaikan pengecualian 'PSQLException: Ralat: Membatalkan pernyataan kerana permintaan pengguna' dalam aplikasi Springboot?Apr 19, 2025 pm 02:45 PM

Dalam aplikasi springboot, kolam sambungan PGJDBC melemparkan psqlexception: Ralat: PembatalanStatementDuetouserRequest Pengecualian digunakan. Springboot mybatis-plus ...

Bagaimana untuk merancang algoritma loteri untuk memastikan anda tidak kehilangan wang?Bagaimana untuk merancang algoritma loteri untuk memastikan anda tidak kehilangan wang?Apr 19, 2025 pm 02:42 PM

Bagaimana untuk merancang algoritma loteri untuk memastikan anda tidak kehilangan wang? Apabila merancang produk loteri, bagaimana untuk menetapkan kebarangkalian kemenangan setiap hadiah adalah soalan utama. Dengan mengandaikan ...

Bagaimana cara menyaring dan menyegerakkan data hotspot untuk meningkatkan kecekapan penyegerakan data berskala besar?Bagaimana cara menyaring dan menyegerakkan data hotspot untuk meningkatkan kecekapan penyegerakan data berskala besar?Apr 19, 2025 pm 02:39 PM

Bagaimana untuk mengoptimumkan penapisan dan penyegerakan data hotspot? Apabila berurusan dengan penyegerakan data berskala besar, bagaimana untuk menapis data hotspot secara berkesan telah menjadi isu utama. Dengan mengandaikan bahawa ada ...

Bolehkah benang maya dan multithreading selari mencapai prestasi konvensional 'tidak terkalahkan' dalam pengaturcaraan Java?Bolehkah benang maya dan multithreading selari mencapai prestasi konvensional 'tidak terkalahkan' dalam pengaturcaraan Java?Apr 19, 2025 pm 02:36 PM

Java Virtual Threading dan Multithreading Selari: Cabaran Keserasian Dalam pengaturcaraan Java, pengenalan benang maya menyediakan pemaju dengan kaedah pemprosesan konvensional yang lebih efisien. � ...

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

SublimeText3 Linux versi baharu

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.