Heim  >  Artikel  >  Java  >  Wie extrahiere ich Domänennamen zuverlässig aus URLs mit java.net.URI?

Wie extrahiere ich Domänennamen zuverlässig aus URLs mit java.net.URI?

Susan Sarandon
Susan SarandonOriginal
2024-11-02 11:30:30807Durchsuche

How to Reliably Extract Domain Names from URLs Using java.net.URI?

Domänennamen aus einer URL extrahieren

Ihre ursprüngliche Lösung zum Extrahieren des Domänennamens aus einer URL ist einigermaßen funktionsfähig, weist jedoch Einschränkungen auf und mögliche Grenzfälle. Dieser Artikel stellt einen verfeinerten Ansatz unter Verwendung von java.net.URI anstelle von java.net.URL vor.

Zu den Hauptnachteilen Ihrer Lösung gehören:

  • Anfälligkeit für Denial-of-Service-Angriffe durch Java Die DNS-Suche von .net.URL in der Methode „equals“.
  • Falsche Handhabung verschiedener gültiger URL-Formate, z. B. solche mit relativen Pfaden, Protokollen ohne Berücksichtigung der Groß-/Kleinschreibung usw.

Verbesserter Ansatz mit java.net.URI

java.net.URI bietet eine robustere und zuverlässigere Methode zum Parsen von URLs. Das aktualisierte Code-Snippet:

<code class="java">public static String getDomainName(String url) throws URISyntaxException {
    URI uri = new URI(url);
    String domain = uri.getHost();
    return domain.startsWith("www.") ? domain.substring(4) : domain;
}</code>

Randfälle und Überlegungen

Dieser überarbeitete Ansatz befasst sich mit den Randfällen, die in Ihrem ursprünglichen Code aufgetreten sind. Es verarbeitet:

  • Relative URLs mit Pfaden, die mit „http“ beginnen
  • Groß-/Kleinschreibung bei Protokollen
  • URLs ohne Protokolle
  • URLs, die mit „ beginnen www“, stimmt aber nicht mit dem Domänennamenmuster überein

Darüber hinaus hält sich der integrierte URI-Parser strikt an die RFC 3986-Grammatik und gewährleistet so eine genaue Analyse komplexer URLs.

Abschließend: Die Verwendung von java.net.URI bietet eine umfassendere und zuverlässigere Lösung zum Extrahieren von Domänennamen aus URLs, beseitigt potenzielle Fallstricke und gewährleistet eine robuste Handhabung verschiedener URL-Formate.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Domänennamen zuverlässig aus URLs mit java.net.URI?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn