Quels sont les équivalents Unicode pour \w et \b de Java dans les expressions régulières ?-javaDidacticiel-php.cn

Maison

Java

javaDidacticiel

Quels sont les équivalents Unicode pour \w et \b de Java dans les expressions régulières ?

DDD

Dec 13, 2024 pm 02:55 PM

What are the Unicode-aware equivalents for Java's w and b in regular expressions?

Équivalents Unicode pour w et b dans les expressions régulières Java ?

Les expressions rationnelles Java ont des raccourcis de classe de caractères limités (w et b) par rapport aux autres implémentations modernes de regex. En Java, w correspond uniquement à [A-Za-z0-9_], ce qui limite les capacités de correspondance de mots. De plus, la sémantique des limites des mots de b s'écarte des définitions de w et d'Unicode.

Équivalents compatibles Unicode

Heureusement, des équivalents personnalisés compatibles Unicode ont été développés pour surmonter ces limitations. . Voici les remplacements :

\s: [\u0009-\u000D\u0020\u0085\u00A0\u1680\u180E\u2000-\u200A\u2028\u2029\u202F\u205F\u3000]
\S: [^\u0009-\u000D\u0020\u0085\u00A0\u1680\u180E\u2000-\u200A\u2028\u2029\u202F\u205F\u3000]

\v: [\u000A-\u000D\u0085\u2028\u2029]
\V: [^\u000A-\u000D\u0085\u2028\u2029]

\h: [\u0009\u0020\u00A0\u1680\u180E\u2000-\u200A\u202F\u205F\u3000]
\H: [^\u0009\u0020\u00A0\u1680\u180E\u2000-\u200A\u202F\u205F\u3000]

\w: [\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&&\p{So}]]
\W: [^\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&&\p{So}]]

\b: (?:(?&&\p{So}]])(?![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&&\p{So}]])|(?&&\p{So}]])(?=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&&\p{So}]]))
\B: (?:(?&&\p{So}]])(?=[\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&&\p{So}]])|(?&&\p{So}]])(?![\pL\pM\p{Nd}\p{Nl}\p{Pc}[\p{InEnclosedAlphanumerics">&&\p{So}]]))

\d: \p{Nd}
\D: \P{Nd}

\R: (?:(?>\u000D\u000A)|[\u000A\u000B\u000C\u000D\u0085\u2028\u2029])
\X: (?>\PM\pM*)

Comprendre les limites (b et B)

Les limites correspondent aux positions où les caractères de mots passent aux caractères non-mots ou vice versa. Une limite est définie comme :

IF follows word
THEN doesn't precede word
ELSIF doesn't follow word
THEN does precede word

Traduit en syntaxe regex :

(?:(?<p>De même, l'équivalent non-frontière (B) est :</p><pre class="brush:php;toolbar:false">(?:(?<p> <strong>Incorporation du support Unicode dans Java</strong></p><p>Pour incorporer ces équivalents Unicode dans votre Java regex, vous pouvez utiliser une fonction de réécriture de chaîne pour transformer le modèle avant la compilation. Voici un exemple utilisant une fonction personnalisée appelée rewrite :</p><pre class="brush:php;toolbar:false">String rewrittenPattern = rewrite(originalPattern);
Pattern compiledPattern = Pattern.compile(rewrittenPattern);

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Comment l'indépendance de la plate-forme profite-t-elle aux applications Java au niveau de l'entreprise?May 03, 2025 am 12:23 AM

Java est largement utilisé dans les applications au niveau de l'entreprise en raison de son indépendance de la plate-forme. 1) L'indépendance de la plate-forme est implémentée via Java Virtual Machine (JVM), afin que le code puisse fonctionner sur n'importe quelle plate-forme qui prend en charge Java. 2) Il simplifie les processus de déploiement et de développement multiplateforme, offrant une plus grande flexibilité et évolutivité. 3) Cependant, il est nécessaire de prêter attention aux différences de performance et à la compatibilité des bibliothèques tierces et à adopter les meilleures pratiques telles que l'utilisation du code Java pur et des tests multiplateformes.

Quel rôle Java joue-t-il dans le développement des appareils IoT (Internet des objets), en considérant l'indépendance de la plate-forme?May 03, 2025 am 12:22 AM

JavaplaysaSignificantroleiniotDuetOtsPlatformIndependence.1)

Décrivez un scénario où vous avez rencontré un problème spécifique à la plate-forme en Java et comment vous l'avez résolu.May 03, 2025 am 12:21 AM

Thes solution tohandlefilepathsacrosswindowsandlinuxinjavaistouspaths.get () fromthejava.nio.filepackage.1) usePaths.get () withystem.getproperty ("user.dir") et therelatif

Quels sont les avantages de l'indépendance de la plate-forme de Java pour les développeurs?May 03, 2025 am 12:15 AM

Java'splatformIndependanceissignifificantBecauseitAllowsDeveloperstowRiteCodeOnceAndUniTonanyPlatFormwithajvm. This "WriteOnce, runanywhere" (wora) approchoffers: 1) cross-plateformcompatibilité, activant la réévaluation

Quels sont les avantages de l'utilisation de Java pour les applications Web qui doivent s'exécuter sur différents serveurs?May 03, 2025 am 12:13 AM

Java convient pour développer des applications Web inter-serveur. 1) La philosophie de "Write Once, Run Everwhere" de Java fait fonctionner son code sur n'importe quelle plate-forme qui prend en charge JVM. 2) Java a un écosystème riche, y compris des outils tels que le printemps et l'hibernate, pour simplifier le processus de développement. 3) Java fonctionne parfaitement dans la performance et la sécurité, offrant une gestion efficace de la mémoire et de solides garanties de sécurité.

Comment le JVM contribue-t-il à la capacité de 'écrire une fois, d'exécuter n'importe où' de Java (WORA)?May 02, 2025 am 12:25 AM

JVM implémente les fonctionnalités WORA de Java via l'interprétation des bytecodes, les API indépendantes de la plate-forme et le chargement de classe dynamique: 1. ByteCode est interprété comme du code machine pour assurer le fonctionnement de la plate-forme multiplié; 2. Différences de système d'exploitation abstraites API standard; 3. Les classes sont chargées dynamiquement au moment de l'exécution pour assurer la cohérence.

Comment les versions plus récentes de Java abordent-elles les problèmes spécifiques à la plate-forme?May 02, 2025 am 12:18 AM

La dernière version de Java résout efficacement les problèmes spécifiques à la plate-forme grâce à l'optimisation JVM, aux améliorations de la bibliothèque standard et à la prise en charge de la bibliothèque tierce. 1) L'optimisation JVM, comme le ZGC de Java11, améliore les performances de la collecte des ordures. 2) Améliorations standard des bibliothèques, telles que le système de module de Java9, réduisant les problèmes liés à la plate-forme. 3) Les bibliothèques tierces fournissent des versions optimisées à plateforme, telles que OpenCV.

Expliquez le processus de vérification bytecode effectué par le JVM.May 02, 2025 am 12:18 AM

Le processus de vérification Bytecode de JVM comprend quatre étapes de clé: 1) Vérifiez si le format de fichier de classe est conforme aux spécifications, 2) vérifiez la validité et l'exactitude des instructions de bytecode, 3) effectuer une analyse du flux de données pour assurer la sécurité du type et 4) équilibrant la minutie et les performances de la vérification. Grâce à ces étapes, le JVM garantit que seul le bytecode sécurisé est exécuté, protégeant ainsi l'intégrité et la sécurité du programme.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

4 Il y a quelques semainesByDDD

Comment réparer KB5055523 ne parvient pas à s'installer dans Windows 11?

3 Il y a quelques semainesByDDD

Comment réparer KB5055518 ne parvient pas à s'installer dans Windows 10?

3 Il y a quelques semainesByDDD

Niveaux de force pour chaque ennemi et monstre de R.E.P.O.

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Blue Prince: Comment se rendre au sous-sol

3 Il y a quelques semainesByDDD

Afficher plus

Outils chauds

Télécharger la version Mac de l'éditeur Atom

L'éditeur open source le plus populaire

MinGW - GNU minimaliste pour Windows

Ce projet est en cours de migration vers osdn.net/projects/mingw, vous pouvez continuer à nous suivre là-bas. MinGW : un port Windows natif de GNU Compiler Collection (GCC), des bibliothèques d'importation et des fichiers d'en-tête librement distribuables pour la création d'applications Windows natives ; inclut des extensions du runtime MSVC pour prendre en charge la fonctionnalité C99. Tous les logiciels MinGW peuvent fonctionner sur les plates-formes Windows 64 bits.

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Navigateur d'examen sécurisé

Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.

Afficher plus

Sujets chauds

Où se trouve l’entrée de connexion pour la messagerie Gmail ?

7930

1652

1411

1303

1250