Maison > Article > développement back-end > Comment capturer des blocs de texte multilignes avec des expressions régulières ?
Expression régulière pour faire correspondre des blocs de texte multilignes
La correspondance de texte qui s'étend sur plusieurs lignes peut présenter des défis dans la construction d'expressions régulières. Considérons l'exemple de texte suivant :
some Varying TEXT DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF [more of the above, ending with a newline] [yep, there is a variable number of lines here] (repeat the above a few hundred times)
L'objectif est de capturer deux composants : la partie « du TEXTE variable » et toutes les lignes suivantes de texte en majuscule, à l'exclusion de la ligne vide.
Approches incorrectes :
Certaines approches incorrectes pour résoudre ce problème incluent :
Solution :
L'expression régulière suivante capture correctement les composants souhaités :
^(.+)\n((?:\n.+)+)
Voici une répartition de ses composants :
Utilisation :
Pour utiliser cette expression régulière en Python, vous pouvez utiliser le code suivant :
<code class="python">import re pattern = re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)</code>
Vous pouvez ensuite utiliser la méthode match() pour rechercher des correspondances dans une chaîne :
<code class="python">match = pattern.match(text) if match: text1 = match.group(1) text2 = match.group(2)</code>
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!