Rumah >Java >javaTutorial >Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?
Kelas URL pakej java.net mewakili Uniform Resource Locator yang digunakan untuk menunjukkan sumber (fail atau, direktori atau rujukan) dalam web seluruh dunia.
The openStream() kaedah kelas ini membuka sambungan ke URL yang diwakili oleh objek semasa dan mengembalikan objek InputStream yang menggunakan mana anda boleh membaca data daripada URL.
Oleh itu, untuk membaca data dari halaman web (menggunakan kelas URL) −
Segera kelas java.net.URL dengan menghantar URL halaman web yang diingini sebagai parameter kepada pembinanya.
Panggil kaedah openStream() dan dapatkan semula objek InputStream.
import java.io.IOException; import java.net.URL; import java.util.Scanner; public class ReadingWebPage { public static void main(String args[]) throws IOException { //Instantiating the URL class URL url = new URL("http://www.something.com/"); //Retrieving the contents of the specified page Scanner sc = new Scanner(url.openStream()); //Instantiating the StringBuffer class to hold the result StringBuffer sb = new StringBuffer(); while(sc.hasNext()) { sb.append(sc.next()); //System.out.println(sc.next()); } //Retrieving the String from the String Buffer object String result = sb.toString(); System.out.println(result); //Removing the HTML tags result = result.replaceAll("<[^>]*>", ""); System.out.println("Contents of the web page: "+result); } }
<html><body><h1>Itworks!</h1></body></html> Contents of the web page: Itworks!🎜
Atas ialah kandungan terperinci Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!