Maison >développement back-end >tutoriel php >Comment extraire du texte entre les titres HTML en PHP ?
Analyse HTML PHP : extraction de texte entre les titres
En PHP, l'analyse du code HTML peut être réalisée par diverses méthodes. Lorsqu'il s'agit de HTML stocké dans une variable, il est conseillé d'éviter les expressions régulières pour des raisons de fiabilité.
Utilisation du modèle objet de document PHP (DOM)
Le DOM PHP fournit un approche structurée de l'analyse HTML :
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; $DOM = new DOMDocument; $DOM->loadHTML($str); $items = $DOM->getElementsByTagName('h1'); for ($i = 0; $i < $items->length; $i++) echo $items->item($i)->nodeValue . "<br/>";
Cela permettra sortie :
T1 T2 T3
Approche alternative : expression régulière
Si la sortie souhaitée est le texte entre les titres, une expression régulière peut être utilisée :
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; echo preg_replace("#<h1.*?>.*?</h1>#", "", $str);
Cette expression supprime toutes les balises HTML et récupère le texte :
Lorem ipsum.The quick red fox...... jumps over the lazy brown FROG
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!