Maison >développement back-end >Tutoriel Python >Comment récupérer du contenu spécifique à partir d'une correspondance d'expression régulière ?
Récupération de contenu spécifique à partir d'une correspondance d'expression régulière
Lors de l'extraction d'informations à partir de HTML à l'aide d'expressions régulières, vous pouvez rencontrer des cas où vous devez récupérer contenu spécifique au sein d’un match. Ceci peut être réalisé à l'aide de groupes de capture et de référencement indexé.
Capturer du contenu avec des parenthèses
Pour capturer une partie d'une correspondance d'expression régulière, placez-la entre parenthèses ( ). Cela crée un groupe de capture. Par exemple, pour capturer uniquement le contenu du champ
title_search = re.search('<title>(.*)</title>', html, re.IGNORECASE)
Récupération du contenu capturé
Après avoir effectué la recherche, vous pouvez récupérer le contenu capturé à l'aide de la méthode group() avec un index correspondant à la capture numéro de groupe (à partir de 1). Dans ce cas, le titre est capturé par le groupe 1 :
if title_search: title = title_search.group(1)
Élimination du besoin de manipulation de chaînes
Cette approche élimine le besoin d'étapes supplémentaires pour supprimer le
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!