Maison >développement back-end >Tutoriel Python >Comment extraire du texte entre des chaînes à l'aide d'expressions régulières ?
Faire correspondre le texte entre les chaînes à l'aide d'expressions régulières
Lorsque vous travaillez avec des données textuelles, il est souvent nécessaire d'extraire des parties spécifiques en fonction de modèles ou de limites prédéfinis. . Les expressions régulières constituent un outil puissant pour de telles tâches, permettant une manipulation de texte précise et efficace.
Considérez le problème de l'extraction de texte entre deux chaînes spécifiques. Étant donné une chaîne telle que "Partie 1. Partie 2. Partie 3 puis plus de texte", l'objectif est de rechercher et de capturer le texte entre "Partie 1" et "Partie 3".
L'expression régulière Approche
Python fournit une bibliothèque complète d'expressions régulières qui peut être utilisée pour résoudre ce problème. Voici une solution étape par étape :
Définissez l'expression régulière (regex) :
import re regex = r'Part 1\.(.*?)Part 3'
Cette regex précise que nous' Vous recherchez "Partie 1" suivi d'un nombre quelconque de caractères (représentés par ".*?") avant la chaîne "Partie 3".
Créez un objet modèle :
pattern = re.compile(regex)
Effectuer la correspondance de motifs :
match_obj = pattern.search(string)
Récupérer le correspondant Texte :
if match_obj: matched_text = match_obj.group(1)
La méthode "group(1)" extrait le texte capturé entre parenthèses dans l'expression régulière.
Exemple d'utilisation :
Étant donné la chaîne "Partie 1. Partie 2. Partie 3 puis plus de texte", la sortie du code serait :
matched_text = '. Part 2. '
Approche alternative :
S'il existe plusieurs occurrences du modèle, vous pouvez utiliser la fonction "re.findall" au lieu de "re.search" pour obtenir une liste de toutes les correspondances.
match_list = re.findall(r'Part 1\.(.*?)Part 3', string)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!