首頁 >php教程 >php手册 >PHP學習筆記:透過curl實現採集網站內容

PHP學習筆記:透過curl實現採集網站內容

WBOY
WBOY原創
2016-10-15 10:31:501351瀏覽

  關於curl,請各位同學自行百度,我直接上案例。

  先開啟你的curl拓展,在php.ini檔案把curl拓展開啟,也就是取消extension=php_curl.dll的分號。

eg:利用curl採集網站內容,並輸出到txt文件:

  目標:抓取本部落格首頁,並輸出到文件

<span style="font-size: 18px;"><?<span style="color: #000000;">php
</span><span style="color: #800080;">$ch</span> = curl_init("http://www.cnblogs.com/jianqingwang/"<span style="color: #000000;">);
</span><span style="color: #800080;">$fp</span> = <span style="color: #008080;">fopen</span>("example_jianqingwang.txt", "w"<span style="color: #000000;">);

curl_setopt(</span><span style="color: #800080;">$ch</span>, CURLOPT_FILE, <span style="color: #800080;">$fp</span><span style="color: #000000;">);
curl_setopt(</span><span style="color: #800080;">$ch</span>, CURLOPT_HEADER, 0<span style="color: #000000;">);

curl_exec(</span><span style="color: #800080;">$ch</span><span style="color: #000000;">);
curl_close(</span><span style="color: #800080;">$ch</span><span style="color: #000000;">);
</span><span style="color: #008080;">fclose</span>(<span style="color: #800080;">$fp</span><span style="color: #000000;">);
</span>?></span>

效果:

eg:抓取網站內容,並直接輸出

      目標:抓取http://www.cnblogs.com/jianqingwang/,直接輸出



// 1. 初始化
// 1. 初始化

// 1. 初始化
$ch = curl_init();
// 2. 設定選項,包括URL$URch, .cnblogs.com/jianqingwang/");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0);//改為0就不輸出
curl_setopt($ch, CUR3% .執行並取得HTML文件內容
$output = curl_exec($ch);
/// 4. 釋放curl句柄
curl_close($ch);?

curl_close($ch);?

<span style="font-size: 18px;"> </span>

效果:

    說明:這裡介面有點不一樣,是因為css和圖片位址都是相對路徑,所以圖片、css都失效了。

 

eg:
🎜 🎜🎜
陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn