Heim  >  Artikel  >  Java  >  Wie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?

Wie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?

王林
王林nach vorne
2023-09-02 08:45:081071Durchsuche

Wie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?

Die URL-Klasse des java.net-Pakets stellt einen Uniform Resource Locator dar, der verwendet wird, um auf eine Ressource (Datei, Verzeichnis oder Referenz) im World Wide Web zu verweisen.

Der openStream() Die -Methode dieser Klasse öffnet eine Verbindung zu der URL, die durch das aktuelle Objekt dargestellt wird, und gibt ein InputStream-Objekt zurück, mit dem Sie Daten von der URL lesen können.

Daher ist das Lesen von Daten von einer Webseite (mithilfe der URL-Klasse) −

  • Instanziieren Sie die Klasse java.net.URL, indem Sie die URL der gewünschten Webseite als Parameter an ihren Konstruktor übergeben.

  • Rufen Sie die openStream()-Methode auf und rufen Sie das InputStream-Objekt ab.

  • Instanziieren Sie den Scanner Klasse, indem Sie das oben abgerufene InputStream-Objekt als Parameter übergeben.

Beispiel

import java.io.IOException;
import java.net.URL;
import java.util.Scanner;
public class ReadingWebPage {
   public static void main(String args[]) throws IOException {
      //Instantiating the URL class
      URL url = new URL("http://www.something.com/");
      //Retrieving the contents of the specified page
      Scanner sc = new Scanner(url.openStream());
      //Instantiating the StringBuffer class to hold the result
      StringBuffer sb = new StringBuffer();
      while(sc.hasNext()) {
         sb.append(sc.next());
         //System.out.println(sc.next());
      }
      //Retrieving the String from the String Buffer object
      String result = sb.toString();
      System.out.println(result);
      //Removing the HTML tags
      result = result.replaceAll("<[^>]*>", "");
      System.out.println("Contents of the web page: "+result);
   }
}

输出

<html><body><h1>Itworks!</h1></body></html>
Contents of the web page: Itworks!

Das obige ist der detaillierte Inhalt vonWie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:tutorialspoint.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen