Maison >développement back-end >C++ >Comment extraire les valeurs d'attribut href des liens à l'aide de Regex ?

Comment extraire les valeurs d'attribut href des liens à l'aide de Regex ?

Barbara Streisand
Barbara Streisandoriginal
2025-01-10 07:53:42156parcourir

How to Extract href Attribute Values from  Links Using Regex?

Utilisez des expressions régulières pour extraire la valeur de l'attribut href du lien

Pour extraire efficacement la valeur href du lien à l'aide d'expressions régulières, nous pouvons procéder comme suit :

<code><a\s+(?:[^>]*?\s+)?href=(["'])(.*?)</code>

Cette expression régulière contient les éléments suivants :

  • correspond à la balise d'ouverture , en ignorant les caractères d'espacement facultatifs.
  • (?:1*?s )?: correspond à tous les attributs intermédiaires et caractères d'espace avant l'attribut 'href', ce qui le rend facultatif.
  • href=(["']) : correspond à l'attribut 'href', suivi de guillemets simples (') ou de guillemets doubles (").
  • (.*?): Capturez la valeur réelle 'href' en tant que sous-correspondance.
  • 1 : Correspond au guillemet fermant de la valeur 'href'.

Instructions :

Cette expression régulière correspond à l'intégralité de l'élément et regroupe la valeur 'href' dans un deuxième groupe de capture. Des attributs supplémentaires ou des espaces sont autorisés dans la partie facultative après la balise d'ouverture . La correspondance des guillemets garantit que les valeurs « href » entourées de guillemets simples et doubles sont capturées.

Remarque :

Pour une analyse plus fiable de la balise et de ses attributs, il est préférable d'envisager d'utiliser un analyseur HTML. Cependant, cette expression régulière fournit un moyen simple et efficace d'extraire les valeurs href.

---
  1. >

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn