Rumah >Java >javaTutorial >Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?

Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?

王林
王林ke hadapan
2023-09-02 08:45:081115semak imbas

Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?

Kelas URL pakej java.net mewakili Uniform Resource Locator yang digunakan untuk menunjukkan sumber (fail atau, direktori atau rujukan) dalam web seluruh dunia.

The openStream() kaedah kelas ini membuka sambungan ke URL yang diwakili oleh objek semasa dan mengembalikan objek InputStream yang menggunakan mana anda boleh membaca data daripada URL.

Oleh itu, untuk membaca data dari halaman web (menggunakan kelas URL) −

  • Segera kelas java.net.URL dengan menghantar URL halaman web yang diingini sebagai parameter kepada pembinanya.

  • Panggil kaedah openStream() dan dapatkan semula objek InputStream.

  • Instantia

    kelas dengan menghantar objek InputStream yang diambil di atas sebagai parameter.

Contoh

import java.io.IOException;
import java.net.URL;
import java.util.Scanner;
public class ReadingWebPage {
   public static void main(String args[]) throws IOException {
      //Instantiating the URL class
      URL url = new URL("http://www.something.com/");
      //Retrieving the contents of the specified page
      Scanner sc = new Scanner(url.openStream());
      //Instantiating the StringBuffer class to hold the result
      StringBuffer sb = new StringBuffer();
      while(sc.hasNext()) {
         sb.append(sc.next());
         //System.out.println(sc.next());
      }
      //Retrieving the String from the String Buffer object
      String result = sb.toString();
      System.out.println(result);
      //Removing the HTML tags
      result = result.replaceAll("<[^>]*>", "");
      System.out.println("Contents of the web page: "+result);
   }
}

输出
<html><body><h1>Itworks!</h1></body></html>
Contents of the web page: Itworks!
🎜

Atas ialah kandungan terperinci Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:tutorialspoint.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam