Maison >développement back-end >tutoriel php >Comment détecter des URL de formats variés à l'aide d'expressions régulières ?

Comment détecter des URL de formats variés à l'aide d'expressions régulières ?

Susan Sarandon
Susan Sarandonoriginal
2024-10-22 08:45:30778parcourir

How to Detect URLs of Varying Formats Using Regular Expressions?

Détection d'URL avec des formats variables à l'aide d'expressions régulières

Les expressions régulières constituent un moyen puissant d'extraire des données de chaînes complexes, y compris des URL. Que vous travailliez ou non avec des URL contenant les préfixes "http://www", une expression régulière complète peut répondre à vos besoins.

L'expression suivante a été conçue pour faire correspondre les URL avec et sans le préfixe "http Préfixe ://www" :

((https?|ftp)://)?([a-z0-9+!*(),;?&=$_.-]+(:[a-z0-9+!*(),;?&=$_.-]+)?@)?([a-z0-9\-\.]*)\.(([a-z]{2,4})|([0-9]{1,3}\.([0-9]{1,3})\.([0-9]{1,3})))(:[0-9]{2,5})?(/([a-z0-9+$_%-]\.?)+)*/?(\?[a-z+&$_.-][a-z0-9;:@&%=+/$_.-]*)?(#[a-z_.-][a-z0-9+$%_.-]*)?

Cette expression intègre les composants suivants :

  • Schéma : "(https?|ftp)://"
  • Utilisateur et mot de passe : "([a-z0-9 !*(),;?&=$_.-] (:[a-z0-9 !*(),;?&=$_.-] )?@)"
  • Hôte ou adresse IP : "([a-z0-9-.]*).(([a-z]{2,4})|([0-9]{1 ,3}.([0-9]{1,3}).([0-9]{1,3})))"
  • Port : "(:[0-9]{2 ,5})?"
  • Chemin : "(/([a-z0-9 $_%-].?) )*/?
  • GET Requête : "(?a-z &$_.-*)?"
  • Anchor : "(#a-z_.-*)?"

Pour utiliser cette expression, vous pouvez utiliser le code PHP ci-dessous :

if(preg_match("~^$regex$~i", 'www.example.com/etcetc', $m))
    var_dump($m);

if(preg_match("~^$regex$~i", 'http://www.example.com/etcetc', $m))
    var_dump($m);

Ce code fera correspondre avec succès les deux URL, quelle que soit la présence du préfixe "http://www".

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn