Maison >développement back-end >tutoriel php >Comment extraire du texte entre les titres HTML en PHP ?

Comment extraire du texte entre les titres HTML en PHP ?

Barbara Streisand
Barbara Streisandoriginal
2024-12-31 07:40:13182parcourir

How to Extract Text Between HTML Headings in PHP?

Analyse HTML PHP : extraction de texte entre les titres

En PHP, l'analyse du code HTML peut être réalisée par diverses méthodes. Lorsqu'il s'agit de HTML stocké dans une variable, il est conseillé d'éviter les expressions régulières pour des raisons de fiabilité.

Utilisation du modèle objet de document PHP (DOM)

Le DOM PHP fournit un approche structurée de l'analyse HTML :

$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG';
$DOM = new DOMDocument;
$DOM->loadHTML($str);
$items = $DOM->getElementsByTagName('h1');
for ($i = 0; $i < $items->length; $i++)
    echo $items->item($i)->nodeValue . "<br/>";

Cela permettra sortie :

T1
T2
T3

Approche alternative : expression régulière

Si la sortie souhaitée est le texte entre les titres, une expression régulière peut être utilisée :

$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG';
echo preg_replace("#<h1.*?>.*?</h1>#", "", $str);

Cette expression supprime toutes les balises HTML et récupère le texte :

Lorem ipsum.The quick red fox...... jumps over the lazy brown FROG

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn