Maison > Article > développement back-end > Comment extraire un texte spécifique du HTML à l'aide de DOMDocument et XPath de PHP ?
Analyser le HTML avec le DOMDocument de PHP
Pour extraire des éléments de texte spécifiques du HTML à l'aide du DOMDocument de PHP, exploiter les requêtes XPath peut être plus efficace que de s'appuyer uniquement sur sur DOMDocument :: getElementsByTagName. Les requêtes XPath permettent une sélection précise basée sur des critères spécifiques au sein de la structure du document.
Capturer du texte à partir de DIV imbriqués
L'exemple HTML fourni contient des fichiers
Pour capturer le texte cible, une requête XPath peut être utilisée :
<code class="php">$xpath->query('//div[@class="main"]/div[@class="text"]');</code>
Cette requête sélectionne tous les éléments
Itération et extraction des valeurs de nœud
Pour accéder au contenu textuel réel, chaque élément correspondant peut être itéré et sa valeur de nœud propriété accessible :
<code class="php">foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }</code>
La fonction trim() est utilisée pour supprimer tout espace de début ou de fin du texte extrait.
Sortie d'exécution
L'exécution du code affichera ce qui suit :
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!