Maison  >  Article  >  Java  >  Comment extraire de manière fiable les noms de domaine des URL à l'aide de java.net.URI ?

Comment extraire de manière fiable les noms de domaine des URL à l'aide de java.net.URI ?

Susan Sarandon
Susan Sarandonoriginal
2024-11-02 11:30:30815parcourir

How to Reliably Extract Domain Names from URLs Using java.net.URI?

Extraire un nom de domaine à partir d'une URL

Votre solution initiale pour extraire le nom de domaine d'une URL est quelque peu fonctionnelle, mais elle présente des limites et cas limites potentiels. Cet article présente une approche raffinée utilisant java.net.URI au lieu de java.net.URL.

Les principaux inconvénients de votre solution incluent :

  • Susceptibilité aux attaques de déni de service dues à Java Recherche DNS de .net.URL dans sa méthode égale.
  • Gestion incorrecte de divers formats d'URL valides, tels que ceux avec des chemins relatifs, des protocoles insensibles à la casse, etc.

Approche améliorée utilisant java.net.URI

java.net.URI fournit une méthode plus robuste et plus fiable pour analyser les URL. L'extrait de code mis à jour :

<code class="java">public static String getDomainName(String url) throws URISyntaxException {
    URI uri = new URI(url);
    String domain = uri.getHost();
    return domain.startsWith("www.") ? domain.substring(4) : domain;
}</code>

Cas extrêmes et considérations

Cette approche révisée répond aux cas extrêmes rencontrés dans votre code d'origine. Il gère :

  • Les URL relatives avec des chemins commençant par "http"
  • Les protocoles insensibles à la casse
  • Les URL sans protocoles
  • Les URL commençant par " www" mais ne correspond pas au modèle de nom de domaine

De plus, l'analyseur d'URI intégré adhère strictement à la grammaire RFC 3986, garantissant une analyse précise des URL complexes.

En conclusion, l'utilisation de java.net.URI offre une solution plus complète et plus fiable pour extraire les noms de domaine des URL, éliminant les pièges potentiels et garantissant une gestion robuste de divers formats d'URL.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn