cari
RumahJavajavaTutorialBagaimanakah Saya Boleh Meningkatkan Sokongan Unicode dalam Ungkapan Biasa Java untuk \w dan \b?

How Can I Improve Unicode Support in Java Regular Expressions for w and b?

Persamaan Unikod untuk w dan b dalam Ungkapan Biasa Java

Pelaksanaan regex Java mempunyai sokongan terhad untuk Unicode, menjadikannya sukar untuk memadankan perkataan atau sempadan perkataan dengan tepat. Pelepasan w dan b lalai hanya sepadan dengan aksara ASCII.

Untuk menangani isu ini, pertimbangkan untuk menggunakan fungsi yang menulis semula pelarian ini, menggantikannya dengan takrifan sedar Unikod. Fungsi ini boleh menulis semula 14 charclass escape berikut:

Definisi Melarikan Diri Ditulis Semula:

  • w: Menangkap huruf, digit dan aksara tanda baca tertentu (p{L}pMp{Nd}p{Nl}p{Pc}[p{InEnclosedAlphanumerics}&&p{So}]])
  • W: Tidak termasuk semua aksara yang dipadankan dengan w
  • s: Padan dengan ruang putih Unicode ([u0009-u000Du0020u0085u00A0u1680u180Eu2000-u200Au2028u2029u202Fu205Fu3000])
  • S: Tidak termasuk semua aksara
  • V: Mengecualikan semua aksara yang dipadankan dengan v
  • h: Memadankan ruang putih mendatar Unikod ([u0009u0020u00A0u1680u180Eu2000-u200Au202Fu205Fu3000])
  • H: Mengecualikan semua aksara yang dipadankan dengan h
  • d:

  • b: Memadankan sempadan perkataan dengan mengambil kira aksara perkataan Unikod sahaja
  • B: Memadankan sempadan bukan perkataan dengan mengambil kira aksara perkataan Unikod
  • X: Memadankan grafem lanjutan kelompok
  • R: Memadankan pemisah baris, termasuk baris Unicode pecah
  • Takrifan Sempadan:

Larian sempadan (b dan B) boleh ditulis semula menggunakan logik berikut:

b : (?:(?B: (?:(?
  • Membetulkan Java dengan Java:
  • Ini fungsi boleh dilaksanakan dalam Java menggunakan kod yang disediakan dalam utas perbincangan asal. Dengan menggunakan kod ini, anda boleh menulis semula corak regex untuk mengendalikan aksara Unicode dengan lebih baik.

    Nota:

    Dalam Java 7, kelas Pattern memperkenalkan bendera UNICODE_CHARACTER_CLASS, yang membolehkan sokongan Unicode untuk ini melarikan diri secara lalai.

    Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Meningkatkan Sokongan Unicode dalam Ungkapan Biasa Java untuk \w dan \b?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

    Kenyataan
    Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
    Adakah Java masih merupakan bahasa yang baik berdasarkan ciri -ciri baru?Adakah Java masih merupakan bahasa yang baik berdasarkan ciri -ciri baru?May 12, 2025 am 12:12 AM

    Javaremainsagoodlanguageduetoitscontinuousevolutionandrobustecosystem.1)

    Apa yang menjadikan Java hebat? Ciri dan faedah utamaApa yang menjadikan Java hebat? Ciri dan faedah utamaMay 12, 2025 am 12:11 AM

    Javaisgreatduetoitsplatformindantrect, robustoopsupport, extensivelibraries, andstrongcommunity.1) platformindependenceviajvmallowscodetorunonvariousplatforms.2)

    Ciri -ciri Java 5 Teratas: Contoh dan PenjelasanCiri -ciri Java 5 Teratas: Contoh dan PenjelasanMay 12, 2025 am 12:09 AM

    Lima ciri utama Java adalah polimorfisme, ekspresi lambda, streamsapi, generik dan pengendalian pengecualian. 1. Polimorfisme membolehkan objek kelas yang berbeza digunakan sebagai objek kelas asas biasa. 2. Ekspresi Lambda menjadikan kod lebih ringkas, terutama sesuai untuk mengendalikan koleksi dan aliran. 3.StreamsAPI dengan cekap memproses set data yang besar dan menyokong operasi deklaratif. 4. Generik menyediakan jenis keselamatan dan kebolehgunaan semula, dan kesilapan jenis ditangkap semasa penyusunan. 5. Pengendalian Pengecualian membantu mengendalikan kesilapan dengan elegan dan menulis perisian yang boleh dipercayai.

    Bagaimanakah ciri utama Java mempengaruhi prestasi dan skalabiliti?Bagaimanakah ciri utama Java mempengaruhi prestasi dan skalabiliti?May 12, 2025 am 12:08 AM

    Java'stopfeaturessignificantelyedhanceitsperformanceAndscalability.1) Objek-OrientedPrincipleslikePolymorphismenableFlexiBleyDscalableCode.2)

    JVM Internals: Menyelam jauh ke dalam mesin maya JavaJVM Internals: Menyelam jauh ke dalam mesin maya JavaMay 12, 2025 am 12:07 AM

    Komponen teras JVM termasuk ClassLoader, Runtimedataarea dan ExecutionEngine. 1) Pemuat kelas bertanggungjawab untuk memuatkan, menghubungkan dan memulakan kelas dan antara muka. 2) Runtimedataarea mengandungi Methodarea, Heap, Stack, Pcregister dan Nativemethodstacks. 3) ExecutionEngine terdiri daripada penterjemah, Jitcompiler dan GarbageCollector, yang bertanggungjawab untuk pelaksanaan dan pengoptimuman bytecode.

    Apakah ciri -ciri yang menjadikan Java selamat dan selamat?Apakah ciri -ciri yang menjadikan Java selamat dan selamat?May 11, 2025 am 12:07 AM

    Java'sSafetyandSecurityArebolsteredby: 1) Strongtyping, whichPreventStype-RelatedErrors; 2) AutomaticMemoryManagementViagriageGecollection, reducingMemory-RelatedVulnerabilities;

    Ciri-ciri Java Harus tahu: Meningkatkan Kemahiran Pengekodan AndaCiri-ciri Java Harus tahu: Meningkatkan Kemahiran Pengekodan AndaMay 11, 2025 am 12:07 AM

    JavaoffersSeveralkeyfeaturesthatenHanceCodingsKills: 1) Objek-OrientedProgrammingallowSmodelingReal-Worldentities, exemplifiedBypolymorphism.2) ExceptleHandlingProvidesRobusRrormAragement.3)

    Jvm panduan paling lengkapJvm panduan paling lengkapMay 11, 2025 am 12:06 AM

    TheJvmisacrucialComponentthatrunsjavacodeByTranslatingitintomachine-specificinstructions, impak, keselamatan, andporability.1) theclassloaderloads, pautan, andinitializesclasses.2)

    See all articles

    Alat AI Hot

    Undresser.AI Undress

    Undresser.AI Undress

    Apl berkuasa AI untuk mencipta foto bogel yang realistik

    AI Clothes Remover

    AI Clothes Remover

    Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

    Undress AI Tool

    Undress AI Tool

    Gambar buka pakaian secara percuma

    Clothoff.io

    Clothoff.io

    Penyingkiran pakaian AI

    Video Face Swap

    Video Face Swap

    Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

    Artikel Panas

    Nordhold: Sistem Fusion, dijelaskan
    3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
    Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
    3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

    Alat panas

    SecLists

    SecLists

    SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

    Dreamweaver Mac版

    Dreamweaver Mac版

    Alat pembangunan web visual

    MinGW - GNU Minimalis untuk Windows

    MinGW - GNU Minimalis untuk Windows

    Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.

    SublimeText3 versi Inggeris

    SublimeText3 versi Inggeris

    Disyorkan: Versi Win, menyokong gesaan kod!

    Versi Mac WebStorm

    Versi Mac WebStorm

    Alat pembangunan JavaScript yang berguna