recherche
Maisondéveloppement back-endtutoriel phpComment puis-je extraire de manière fiable les attributs href d'un élément A en HTML ?

How Can I Reliably Extract href Attributes from A Elements in HTML?

Extraire les attributs href d'un élément

Pour récupérer les liens sur une page Web, une approche courante consiste à utiliser des expressions régulières. Cependant, des scénarios spécifiques peuvent poser des défis, par exemple lorsque l'attribut href n'est pas positionné en premier dans la balise A.

Approche d'expression régulière

Votre regex initiale, ciblant le attribut href dans n'importe quelle position dans une balise A, j'ai rencontré des difficultés dans des cas comme "quoi ?".

Solution basée sur DOM

Compte tenu des limites des expressions régulières pour une analyse HTML fiable, une solution plus robuste est le DOMDocument classe en PHP. Voici un exemple :

$dom = new DOMDocument;
$dom->loadHTML($html);
foreach ($dom->getElementsByTagName('a') as $node) {
    echo $dom->saveHtml($node), PHP_EOL;
}

Ce code charge le contenu HTML dans un objet DOMDocument puis récupère tous les éléments A à l'aide de la méthode getElementsByTagName.

Manipulation DOM

A l'aide du DOM, vous pouvez effectuer diverses opérations sur la balise A elements :

  • Obtenir la valeur du texte : Obtenez le texte interne de l'élément en utilisant $node->nodeValue.
  • Vérifiez l'attribut href : Vérifiez si l'élément a un attribut href en utilisant $node->hasAttribute('href').
  • Obtenir l'attribut href : Récupérez la valeur de l'attribut href en utilisant $node->getAttribute('href').
  • Modifier l'attribut href : Modifiez la valeur de l'attribut href en utilisant $node->setAttribute('href', 'new value').
  • Supprimer l'attribut href : Supprimez l'attribut href à l'aide de $node->removeAttribute('href').

XPath pour l'attribut Extraction :

XPath fournit une autre option pour l'extraction d'attributs. Voici un exemple :

$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//a/@href');
foreach($nodes as $href) {
    echo $href->nodeValue;
}

Ressources supplémentaires :

  • Meilleures méthodes pour analyser le HTML
  • DOMDocument en php

Cela vaut la peine de le noter https://www.php.cn/link/274da997412973c08cf7e78724153f55, votre question est peut-être un double et la réponse peut probablement être trouvée dans les discussions existantes.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Comment créez-vous et utilisez-vous une interface dans PHP?Comment créez-vous et utilisez-vous une interface dans PHP?Apr 30, 2025 pm 03:40 PM

L'article explique comment créer, mettre en œuvre et utiliser des interfaces dans PHP, en se concentrant sur leurs avantages pour l'organisation du code et la maintenabilité.

Quelle est la différence entre crypte () et mot de passe_hash ()?Quelle est la différence entre crypte () et mot de passe_hash ()?Apr 30, 2025 pm 03:39 PM

L'article traite des différences entre crypt () et mot de passe_hash () dans PHP pour le hachage de mot de passe, en se concentrant sur leur implémentation, leur sécurité et leur aptitude aux applications Web modernes.

Comment pouvez-vous prévenir les scripts inter-sites (XSS) en PHP?Comment pouvez-vous prévenir les scripts inter-sites (XSS) en PHP?Apr 30, 2025 pm 03:38 PM

L'article discute de la prévention des scripts inter-sites (XSS) dans PHP par validation d'entrée, en codage de sortie et en utilisant des outils comme OWASP ESAPI et Purificateur HTML.

Qu'est-ce que la mise en œuvre automatique dans PHP?Qu'est-ce que la mise en œuvre automatique dans PHP?Apr 30, 2025 pm 03:37 PM

L'autofilage en PHP charge automatiquement les fichiers de classe en cas de besoin, améliorant les performances en réduisant l'utilisation de la mémoire et l'amélioration de l'organisation du code. Les meilleures pratiques incluent l'utilisation de PSR-4 et l'organisation du code efficacement.

Que sont les flux PHP?Que sont les flux PHP?Apr 30, 2025 pm 03:36 PM

PHP Streams Unify Unify Gestion de ressources telles que les fichiers, les prises de réseau et les formats de compression via une API cohérente, l'abstraction de la complexité et l'amélioration de la flexibilité et de l'efficacité du code.

Quelle est la taille maximale d'un fichier qui peut être téléchargé à l'aide de PHP?Quelle est la taille maximale d'un fichier qui peut être téléchargé à l'aide de PHP?Apr 30, 2025 pm 03:35 PM

L'article discute de la gestion des tailles de téléchargement de fichiers dans PHP, en se concentrant sur la limite par défaut de 2 Mo et comment l'augmenter en modifiant les paramètres PHP.ini.

Qu'est-ce que les types nullables en PHP?Qu'est-ce que les types nullables en PHP?Apr 30, 2025 pm 03:34 PM

L'article traite des types nullables en PHP, introduits dans PHP 7.1, permettant aux variables ou aux paramètres d'être soit un type spécifié ou nul. Il met en évidence des avantages tels que l'amélioration de la lisibilité, la sécurité des types et l'intention explicite, et explique comment déclarer

Quelle est la différence entre les fonctions unset () et unlink ()?Quelle est la différence entre les fonctions unset () et unlink ()?Apr 30, 2025 pm 03:33 PM

L'article traite des différences entre les fonctions unset () et unlink () dans la programmation, en se concentrant sur leurs objectifs et leurs cas d'utilisation. Unset () supprime les variables de la mémoire, tandis que Unlink () supprime les fichiers du système de fichiers. Les deux sont cruciaux pour l'effec

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Version crackée d'EditPlus en chinois

Version crackée d'EditPlus en chinois

Petite taille, coloration syntaxique, ne prend pas en charge la fonction d'invite de code

MinGW - GNU minimaliste pour Windows

MinGW - GNU minimaliste pour Windows

Ce projet est en cours de migration vers osdn.net/projects/mingw, vous pouvez continuer à nous suivre là-bas. MinGW : un port Windows natif de GNU Compiler Collection (GCC), des bibliothèques d'importation et des fichiers d'en-tête librement distribuables pour la création d'applications Windows natives ; inclut des extensions du runtime MSVC pour prendre en charge la fonctionnalité C99. Tous les logiciels MinGW peuvent fonctionner sur les plates-formes Windows 64 bits.

DVWA

DVWA

Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel

MantisBT

MantisBT

Mantis est un outil Web de suivi des défauts facile à déployer, conçu pour faciliter le suivi des défauts des produits. Cela nécessite PHP, MySQL et un serveur Web. Découvrez nos services de démonstration et d'hébergement.

Listes Sec

Listes Sec

SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.