java.net 套件的 URL 類別表示統一資源定位器,用於指向資源(檔案或目錄或引用)萬維網。
這個類別的openStream()方法開啟一個到目前物件表示的URL的連接,並傳回一個InputStream對象,使用它你可以從URL 讀取資料。
因此,要從網頁中讀取資料(使用URL 類別) −
透過傳遞以下內容來實例化java.net.URL 類別所需網頁的URL 作為其建構函數的參數。
import java.io.IOException; import java.net.URL; import java.util.Scanner; public class ReadingWebPage { public static void main(String args[]) throws IOException { //Instantiating the URL class URL url = new URL("http://www.something.com/"); //Retrieving the contents of the specified page Scanner sc = new Scanner(url.openStream()); //Instantiating the StringBuffer class to hold the result StringBuffer sb = new StringBuffer(); while(sc.hasNext()) { sb.append(sc.next()); //System.out.println(sc.next()); } //Retrieving the String from the String Buffer object String result = sb.toString(); System.out.println(result); //Removing the HTML tags result = result.replaceAll("<[^>]*>", ""); System.out.println("Contents of the web page: "+result); } }
<html><body><h1>Itworks!</h1></body></html> Contents of the web page: Itworks!
以上是Java中如何在不使用任何外部程式庫的情況下讀取網頁內容?的詳細內容。更多資訊請關注PHP中文網其他相關文章!