Maison >Java >javaDidacticiel >Comment lire le contenu d'une page Web en Java sans utiliser de bibliothèque externe ?
La classe URL du package java.net représente un Uniform Resource Locator qui est utilisé pour pointer une ressource (fichier ou, répertoire ou référence) dans le World Wide Web.
Le openStream() La méthode de cette classe ouvre une connexion à l'URL représentée par l'objet actuel et renvoie un objet InputStream à l'aide duquel vous pouvez lire les données de l'URL.
Par conséquent, pour lire les données de la page Web (en utilisant la classe URL) −
Instancier la classe java.net.URL en passant l'URL de la page Web souhaitée en tant que paramètre à son constructeur.
Invoquez la méthode openStream() et récupérez l'objet InputStream.
Instancier le scanner classe en passant l'objet InputStream récupéré ci-dessus en tant que paramètre.
import java.io.IOException; import java.net.URL; import java.util.Scanner; public class ReadingWebPage { public static void main(String args[]) throws IOException { //Instantiating the URL class URL url = new URL("http://www.something.com/"); //Retrieving the contents of the specified page Scanner sc = new Scanner(url.openStream()); //Instantiating the StringBuffer class to hold the result StringBuffer sb = new StringBuffer(); while(sc.hasNext()) { sb.append(sc.next()); //System.out.println(sc.next()); } //Retrieving the String from the String Buffer object String result = sb.toString(); System.out.println(result); //Removing the HTML tags result = result.replaceAll("<[^>]*>", ""); System.out.println("Contents of the web page: "+result); } }
<html><body><h1>Itworks!</h1></body></html> Contents of the web page: Itworks!
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!