詳細介紹PHP+JavaScript如何爬取網頁內容-php教程-PHP中文網

首頁

後端開發

php教程

詳細介紹PHP+JavaScript如何爬取網頁內容

零到壹度

Apr 11, 2018 pm 05:27 PM

網頁

這篇文章跟大家分享的內容是詳細介紹PHP JavaScript如何爬取網頁內容，有著一定的參考價值，有需要的朋友可以參考一下

php js爬取網頁內容—–先看下效果

詳細介紹PHP+JavaScript如何爬取網頁內容

#如何做到的呢？

我們一直以為只有Python才能爬取網頁內容，那是因為Python本身集合很多類別庫用來爬取網頁很方便，但是我們使用PHP js的方法一樣很方便，一樣可以拿到我們想要的網頁內容，而且也不用很繁瑣。

首先我們需要PHP來模擬請求取得整個網站的HTML

  // 允许所有域访问
  header("Access-Control-Allow-Origin: *");
  / 接收一个参数，参数名叫parm
  $parm=$_GET[&#39;mod&#39;];
  if (empty($parm)) {  
    $url = &#39;http://m.80s.tw/&#39;;//詳細介紹PHP+JavaScript如何爬取網頁內容
    $html = file_get_contents($url);
}else{  
  $url = &#39;http://m.80s.tw/&#39;.$parm;    
  $html = file_get_contents($url);
} 
    preg_match("/<body[^>]*?>(.*\s*?)<\/body>/is",$html,$match1);//正则匹配body里面的内容
    echo $match1[0];//输出网页

#注意：如果遇到 file_get_contents報錯請嘗試在php.ini找到extension=php_openssl.dll 開啟就OK了

然後就是前端來獲取資料進行處理了

先寫個非同步請求

$.ajax({ 
        type:&#39;get&#39;,
        url: &#39;.././admin/test.php&#39;,
        success: function(data) {
        console.log(data)//可以看到获取的HTML，很简单吧，很兴奋吧
        }
    });

取得HTML後我們就可以隨心所欲了

#怎麼來使用這些HTML呢？這是問題嗎？不是

        //首先创建一个容器
        var p = document.createElement(&#39;p&#39;);        
        // 把整个html的字符串存到这个p节点里
        p.innerHTML = data;        
        //然后就可以对p一顿检查了
        //比如获取类list_mov_title下所有的a标签
        var list = p.querySelectorAll(&#39;.list_mov_title a&#39;);        
        //赶紧打印出来看一下
        console.log(list)        
        //想要的东西都在吧
        //然后就把想要的东西往自己的页面里面塞吧

一個爬取網頁內容的教學就這樣結束了，如果你豁然開朗了就轉發一下吧，不明白的就留言吧

以上是詳細介紹PHP+JavaScript如何爬取網頁內容的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

超越炒作：評估當今PHP的角色Apr 12, 2025 am 12:17 AM

PHP在現代編程中仍然是一個強大且廣泛使用的工具，尤其在web開發領域。 1)PHP易用且與數據庫集成無縫，是許多開發者的首選。 2)它支持動態內容生成和麵向對象編程，適合快速創建和維護網站。 3)PHP的性能可以通過緩存和優化數據庫查詢來提升，其廣泛的社區和豐富生態系統使其在當今技術棧中仍具重要地位。

PHP中的弱參考是什麼？什麼時候有用？Apr 12, 2025 am 12:13 AM

在PHP中，弱引用是通過WeakReference類實現的，不會阻止垃圾回收器回收對象。弱引用適用於緩存系統和事件監聽器等場景，需注意其不能保證對象存活，且垃圾回收可能延遲。

解釋PHP中的__ Invoke Magic方法。Apr 12, 2025 am 12:07 AM

\_\_invoke方法允許對象像函數一樣被調用。 1.定義\_\_invoke方法使對象可被調用。 2.使用$obj(...)語法時，PHP會執行\_\_invoke方法。 3.適用於日誌記錄和計算器等場景，提高代碼靈活性和可讀性。

解釋PHP 8.1中的纖維以進行並發。Apr 12, 2025 am 12:05 AM

Fibers在PHP8.1中引入，提升了並發處理能力。 1)Fibers是一種輕量級的並發模型，類似於協程。 2)它們允許開發者手動控制任務的執行流，適合處理I/O密集型任務。 3)使用Fibers可以編寫更高效、響應性更強的代碼。

PHP社區：資源，支持和發展Apr 12, 2025 am 12:04 AM

PHP社區提供了豐富的資源和支持，幫助開發者成長。 1)資源包括官方文檔、教程、博客和開源項目如Laravel和Symfony。 2)支持可以通過StackOverflow、Reddit和Slack頻道獲得。 3)開發動態可以通過關注RFC了解。 4)融入社區可以通過積極參與、貢獻代碼和學習分享來實現。