Comment le DOMDocument de PHP peut-il extraire et conserver les balises HTML `` d'une table ?
Susan Sarandonoriginal
2024-12-07 17:01:12661parcourir
DOMDocument en PHP : analyse et manipulation de documents HTML
Lorsque vous travaillez avec des documents HTML, le DOM (Document Object Model) fournit un modèle structuré et représentation orientée objet du contenu du document. La classe DOMDocument de PHP nous permet d'interagir avec et de modifier des documents HTML au niveau du nœud.
Pour analyser un document HTML à l'aide de DOMDocument, nous suivons ces étapes :
Créez un objet DOMDocument et chargez le contenu HTML à l'aide de loadHTML().
Utilisez DOMXPath pour interroger et manipuler le contenu analysé document.
Dans votre exemple, vous souhaitez extraire tous les
balises d’un tableau HTML et analyser leur contenu. Cependant, le code que vous avez fourni supprime les balises HTML du résultat, ce qui n'est pas souhaitable.
Pour préserver les balises HTML, nous devons comprendre qu'un DOMDocument représente l'intégralité du document HTML sous la forme d'une structure arborescente hiérarchique, avec des nœuds représentant divers éléments (tels que les balises
ou
) et du texte.
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$trs = $xpath->query('//tr[@id="showContent"]');
foreach ($trs as $tr) {
echo $dom->saveXML($tr);
echo '<br>';
}
Ce code utilise saveXML() pour afficher la représentation HTML réelle de chaque
tag, en préservant les balises et leur contenu. En interrogeant uniquement les fichiers
balises dans le div avec l'ID "showContent", vous pouvez vous concentrer sur des parties spécifiques du document.
Pour extraire des informations spécifiques du
balises, telles que les liens qu'elles contiennent, vous pouvez utiliser d'autres requêtes XPath ou des techniques de navigation DOM pour accéder aux nœuds spécifiques dont vous avez besoin.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn