cari
RumahJavajavaTutorialBagaimana untuk Mengeluarkan Tanda Diakritik daripada Rentetan Unicode di Java?

How to Remove Diacritical Marks from Unicode Strings in Java?

Mengalih keluar Tanda Diakritik daripada Aksara Unikod

Tanda diakritik, seperti tilde, umlaut dan circumflex, boleh mengubah suai sebutan dan ejaan aksara . Untuk memudahkan carian dan perbandingan, tanda ini mungkin perlu dibuang. Begini cara untuk mengalih keluar tanda diakritik daripada aksara Unikod dalam Java:

Menggunakan Borang Normalisasi NFD dan Ungkapan Biasa

Kaedah normalize(Normalizer.Form.NFD) menguraikan Unicode rentetan ke dalam aksara asasnya dan tanda diakritik. Dengan menggabungkan ini dengan ungkapan biasa yang sepadan dengan tanda diakritikal, anda boleh mengeluarkannya daripada rentetan.

import java.util.regex.Pattern;

public class DiacriticRemover {
    public static final Pattern DIACRITICS_PATTERN = Pattern.compile("[\p{InCombiningDiacriticalMarks}]");

    public static String removeDiacritics(String str) {
        return DIACRITICS_PATTERN.matcher(str).replaceAll("");
    }
}

Penggunaan Contoh:

String withDiacritics = "Björń";
String withoutDiacritics = DiacriticRemover.removeDiacritics(withDiacritics);
System.out.println(withoutDiacritics); // Output: Bjorn

Penyederhanaan Rentetan Dipertingkat

Untuk mengendalikan aksara khas bukan diakritik yang boleh menjejaskan carian dan perbandingan, pertimbangkan untuk menggunakan ImmutableMap Google dan pusingan pembersihan tambahan.

import com.google.common.collect.ImmutableMap;

public class StringSimplifier {
    private static final ImmutableMap<string string> NONDIACRITICS = ImmutableMap.<string string>builder()
            // ... (define replacements here)
            .build();

    public static String simplifiedString(String str) {
        return NONDIACRITICS.entrySet().stream()
                .reduce(str, (s, entry) -> s.replaceAll(entry.getKey(), entry.getValue()), String::concat);
    }
}</string></string>

Penggunaan Contoh:

String withNonDiacritics = "Białystok";
String simplified = StringSimplifier.simplifiedString(withNonDiacritics);
System.out.println(simplified); // Output: Bialystok

Dengan menggunakan teknik ini, anda boleh mengalih keluar tanda diakritik dan permudahkan rentetan untuk keupayaan carian dan perbandingan yang dipertingkatkan.

Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Tanda Diakritik daripada Rentetan Unicode di Java?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Adakah platform Java bebas jika bagaimana?Adakah platform Java bebas jika bagaimana?May 09, 2025 am 12:11 AM

Java adalah platform-bebas kerana falsafah reka bentuk "Write Once, Run, Run Everywhere", yang bergantung kepada mesin maya Java (JVMS) dan bytecode. 1) Kod Java disusun menjadi bytecode, ditafsirkan oleh JVM atau disusun dengan lalat secara tempatan. 2) Perhatikan kebergantungan perpustakaan, perbezaan prestasi dan konfigurasi persekitaran. 3) Menggunakan perpustakaan standard, ujian silang platform dan pengurusan versi adalah amalan terbaik untuk memastikan kebebasan platform.

Kebenaran mengenai kemerdekaan platform Java: Adakah ia benar -benar mudah?Kebenaran mengenai kemerdekaan platform Java: Adakah ia benar -benar mudah?May 09, 2025 am 12:10 AM

Java'splatformindependencenotsimple; itinvolvescomplexities.1) jvmcompatibilitymustbeensuredacrossplatforms.2) nativelibrariesandsystemcallsneedcarefulhandling.3)

Kemerdekaan Platform Java: Kelebihan untuk Aplikasi WebKemerdekaan Platform Java: Kelebihan untuk Aplikasi WebMay 09, 2025 am 12:08 AM

Java'splatformindependenceBenefitswebapplicationsbyAllowingCodeToRunonAnySystemWithAjvm, SimplifyDeploymentandscaling.Itenables: 1) EasyDeploymentAcsDifferentservers, 2)

JVM menjelaskan: Panduan Komprehensif ke Mesin Maya JavaJVM menjelaskan: Panduan Komprehensif ke Mesin Maya JavaMay 09, 2025 am 12:04 AM

Thejvmistheruntimeenvironmentforexecutingjavabytecode, crucialforjava's "writeonce, runanywhere" keupayaan

Ciri -ciri utama Java: Mengapa ia kekal sebagai bahasa pengaturcaraan teratasCiri -ciri utama Java: Mengapa ia kekal sebagai bahasa pengaturcaraan teratasMay 09, 2025 am 12:04 AM

JavaremainsatopchoiceFordevelopersDuetoitsplatformindant, Objek-OrientedDesign, StrongTyping, AutomaticMemoryManagement, danComprehensivestandardlibrary.ThesefeatureSmakejavaversatileAndPowerforful

Kemerdekaan Platform Java: Apa maksudnya bagi pemaju?Kemerdekaan Platform Java: Apa maksudnya bagi pemaju?May 08, 2025 am 12:27 AM

Java'splatformindependencemeansdeveloperscanwritecodeonceandrunitonanydeviceWithoutrecompiling.thisisachievedthroughthejavirtualmachine (jvm), yang tidak dapat diperbaiki

Bagaimana untuk menyediakan JVM untuk penggunaan pertama?Bagaimana untuk menyediakan JVM untuk penggunaan pertama?May 08, 2025 am 12:21 AM

Untuk menyediakan JVM, anda perlu mengikuti langkah -langkah berikut: 1) Muat turun dan pasang JDK, 2) Tetapkan Pembolehubah Alam Sekitar, 3) Sahkan pemasangan, 4) Tetapkan IDE, 5) Uji program pelari. Menyediakan JVM bukan sekadar membuatnya berfungsi, ia juga melibatkan pengoptimuman peruntukan memori, pengumpulan sampah, penalaan prestasi, dan pengendalian ralat untuk memastikan operasi yang optimum.

Bagaimana saya boleh menyemak kemerdekaan platform java untuk produk saya?Bagaimana saya boleh menyemak kemerdekaan platform java untuk produk saya?May 08, 2025 am 12:12 AM

Toensurejavaplatformindantret, ikuti: 1) compileAndRunyourapplicationonmultiplePlatformsusingdifferentosandjvmversions.2) Utilizeci/cdpipelinesejenkinsorgithubittionsforautomatedcross-platformtesting.3)

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

EditPlus versi Cina retak

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual