Maison >développement back-end >Tutoriel Python >Comment puis-je faire correspondre de manière fiable des chaînes avec des caractères spéciaux à l'aide des limites de mots de Python ?

Comment puis-je faire correspondre de manière fiable des chaînes avec des caractères spéciaux à l'aide des limites de mots de Python ?

Linda Hamilton
Linda Hamiltonoriginal
2024-12-07 14:17:12984parcourir

How Can I Reliably Match Strings with Special Characters Using Python's Word Boundaries?

Limites de mots et caractères spéciaux en Python

Lors de l'utilisation du modèle b pour la correspondance des limites de mots dans les expressions régulières Python, des résultats inattendus peuvent se produire lorsque le modèle de recherche contient des caractères spéciaux tels que des crochets ou des accolades.

Plus précisément, b ne correspond qu'aux limites des mots où le caractère suivant est un caractère de mot. (alphanumérique ou trait de soulignement). Cela signifie que bSortesindex[persons]{Sortes}, par exemple, ne correspondra pas au texte de test Sortesindex[persons]{Sortes} car Sortes est suivi d'un caractère spécial (}index).

Pour garantir une correspondance appropriée, envisagez ces solutions :

  • Adaptive Word Limites :

    • Utilisez des limites de mots adaptatives qui correspondent au début ou à la fin d'une chaîne ou entre des caractères avec un statut de caractère de mot différent :

      re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
  • Mot sans ambiguïté Limites :

    • Utilisez des limites de mots sans ambiguïté pour n'exiger strictement aucun caractère de mot des deux côtés de la correspondance :

      re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
  • Gérer explicitement les non-mots Limites :

    • Gérez explicitement les limites autres que les mots en utilisant W ou $, telles que :

      re.search(r'\b' + re.escape('Sortes\index[persons]{Sortes}') + '(\W|$)', 'test Sortes\index[persons]{Sortes} test')

De plus, envisagez d'utiliser des recherches négatives pour plus de flexibilité dans la définition des limites des mots. Par exemple, (?

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn