Heim >Java >javaLernprogramm >Wie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?
Die URL-Klasse des java.net-Pakets stellt einen Uniform Resource Locator dar, der verwendet wird, um auf eine Ressource (Datei, Verzeichnis oder Referenz) im World Wide Web zu verweisen.
Der openStream() Die -Methode dieser Klasse öffnet eine Verbindung zu der URL, die durch das aktuelle Objekt dargestellt wird, und gibt ein InputStream-Objekt zurück, mit dem Sie Daten von der URL lesen können.
Daher ist das Lesen von Daten von einer Webseite (mithilfe der URL-Klasse) −
Instanziieren Sie die Klasse java.net.URL, indem Sie die URL der gewünschten Webseite als Parameter an ihren Konstruktor übergeben.
Rufen Sie die openStream()-Methode auf und rufen Sie das InputStream-Objekt ab.
Instanziieren Sie den Scanner Klasse, indem Sie das oben abgerufene InputStream-Objekt als Parameter übergeben.
import java.io.IOException; import java.net.URL; import java.util.Scanner; public class ReadingWebPage { public static void main(String args[]) throws IOException { //Instantiating the URL class URL url = new URL("http://www.something.com/"); //Retrieving the contents of the specified page Scanner sc = new Scanner(url.openStream()); //Instantiating the StringBuffer class to hold the result StringBuffer sb = new StringBuffer(); while(sc.hasNext()) { sb.append(sc.next()); //System.out.println(sc.next()); } //Retrieving the String from the String Buffer object String result = sb.toString(); System.out.println(result); //Removing the HTML tags result = result.replaceAll("<[^>]*>", ""); System.out.println("Contents of the web page: "+result); } }
<html><body><h1>Itworks!</h1></body></html> Contents of the web page: Itworks!
Das obige ist der detaillierte Inhalt vonWie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!