php snoopy用法:1、【fetch($URI)】為了抓取網頁的內容;2、【fetchtext($URI)】移除HTML標籤和其他的無關資料;3、【fetchform($ URI)】返回網頁中表單內容。
本教學操作環境:windows7系統、PHP5.6版,DELL G3電腦。
php snoopy用法:
Snoopy類別方法與範例:
1、fetch($URI)
這是為了抓取網頁的內容而使用的方法。
$URI參數是被抓取網頁的URL位址。
抓取的結果被儲存在 $this->results 中。
如果你正在抓取的是一個框架,Snoopy會將每個框架追蹤後存入數組中,然後存入 $this->results。
2、fetchtext($URI)
本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只返回網頁中的文字內容。
3、fetchform($URI)
本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只返回網頁中表單內容(form)。
4、fetchlinks($URI)
本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只返回網頁中連結(link)。
預設情況下,相對連結會自動補全,轉換成完整的URL。
5、submit($URI,$formvars)
#本方法傳送確認表單給$URL指定的連結位址。 $formvars是一個儲存表單參數的陣列。
6、submittext($URI,$formvars)
本方法類似submit(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只回傳登陸後網頁中的文字內容。
7、submitlinks($URI)
本方法類似submit(),唯一不同的是本方法會移除HTML標籤和其他的無關數據,只返回網頁中連結(link)。
預設情況下,相對連結會自動補全,轉換成完整的URL。
Snoopy擷取類別屬性: (預設值在括號裡)
#$host 連線的主機
#$port 連線的連接埠
$proxy_host 使用的代理主機,如果有的話
$proxy_port 使用的代理主機端口,如果有的話
$agent 用戶代理偽裝(Snoopy v0.1 )
$referer 來路信息,如果有的話
$cookies cookies 如果有的話
$rawheaders 其他的頭資訊, 如果有的話
$maxredirs 最大重定向次數, 0=不允許(5)
$offsiteok whether or not to allow redirects off-site. (true)
$expandlinks 是否將連結都補全為完整位址(true)
$user 認證使用者名稱, 如果有的話
$pass 認證使用者名稱, 如果有的話
$accept http 接受類型(image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, */*)
$error 哪裡報錯, 如果有的話
$response_code 從伺服器傳回的回應代碼
$headers 從伺服器返回的頭資訊
$maxlength 最長返回資料長度
$read_timeout 讀取操作逾時(requires PHP 4 Beta 4 ) 設定為0為沒有逾時
$timed_out 如果一次讀取操作逾時了,本屬性回傳true (requires PHP 4 Beta 4 )
$maxframes 允許追蹤的框架最大數量
$status 抓取的http的狀態
$temp_dir 網頁伺服器能夠寫入的暫存檔案目錄(/tmp)
$curl_path cURL binary 的目錄, 如果沒有cURL binary就設定為false
下面是一個範例:
程式碼如下:
include "Snoopy.class.php"; $snoopy = new Snoopy; $snoopy->proxy_host = "https://www.jb51.net"; $snoopy->proxy_port = "80"; $snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)"; $snoopy->referer = "https://www.jb51.net"; $snoopy->cookies["SessionID"] = 238472834723489l; $snoopy->cookies["favoriteColor"] = "RED"; $snoopy->rawheaders["Pragma"] = "no-cache"; $snoopy->maxredirs = 2; $snoopy->offsiteok = false; $snoopy->expandlinks = false; $snoopy->user = "joe"; $snoopy->pass = "bloe"; if($snoopy->fetchtext("https://www.jb51.net")) { echo "<PRE>".htmlspecialchars($snoopy->results)."\n"; } else echo "error fetching document: ".$snoopy->error."\n";
取得指定url內容
程式碼如下:
<?php $url = "https://www.jb51.net"; include("snoopy.php"); $snoopy = new Snoopy; $snoopy->fetch($url); //获取所有内容 echo $snoopy->results; //显示结果 //可选以下 $snoopy->fetchtext //获取文本内容(去掉html代码) $snoopy->fetchlinks //获取链接 $snoopy->fetchform //获取表单 ?>
表單提交
程式碼如下:
<?php $formvars["username"] = "admin"; $formvars["pwd"] = "admin"; $action = "https://www.jb51.net";//</a>表单提交地址 $snoopy->submit($action,$formvars);//$formvars为提交的数组 echo $snoopy->results; //获取表单提交后的 返回的结果 //可选以下 $snoopy->submittext; //提交后只返回 去除html的 文本 $snoopy->submitlinks;//提交后只返回 链接 ?>
既然已經提交的表單那就可以做很多事情接下來我們來偽裝ip,偽裝瀏覽器
偽裝瀏覽器
程式碼如下:
<?php $formvars["username"] = "lanfengye"; $formvars["pwd"] = "lanfengye"; $action = "https://www.jb51.net"; include "snoopy.php"; $snoopy = new Snoopy; $snoopy->cookies["PHPSESSID"] = 'fc106b1918bd522cc863f36890e6fff7'; //伪装sessionid $snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)"; //伪装浏览器 $snoopy->referer = "https://www.jb51.net"; //伪装来源页地址 http_referer $snoopy->rawheaders["Pragma"] = "no-cache"; //cache 的http头信息 $snoopy->rawheaders["X_FORWARDED_FOR"] = "127.0.0.101"; //伪装ip $snoopy->submit($action,$formvars); echo $snoopy->results; ?>
原來我們可以偽裝session 偽裝瀏覽器,偽裝ip, haha 可以做很多事情了。
例如:帶驗證碼,驗證ip 投票, 可以不停的投。
ps:這裡偽裝ip ,其實是偽裝http頭, 所以一般的透過REMOTE_ADDR
取得的ip是偽裝不了,反而那些透過http頭來取得ip的(可以防止代理的那種) 就可以自己來製造ip。
關於如何驗證碼,簡單說下:
首先用普通的瀏覽器, 查看頁面, 找到驗證碼所對應的sessionid,同時記下sessionid和驗證碼值,接下來就用snoopy去偽造。
原理:由於是同一個sessionid 所以取得的驗證碼和第一次輸入的是一樣的。
有時我們可能需要偽造更多的東西,snoopy完全為我們想到了
<?php $snoopy->proxy_host = "https://www.jb51.net"; $snoopy->proxy_port = "8080"; //使用代理 $snoopy->maxredirs = 2; //重定向次数 $snoopy->expandlinks = true; //是否补全链接 在采集的时候经常用到 // 例如链接为 /images/taoav.gif 可改为它的全链接 <a href="https://www.jb51.net/images/taoav.gif">https://www.jb51.net/images/taoav.gif</a> $snoopy->maxframes = 5 //允许的最大框架数 //注意抓取框架的时候 $snoopy->results 返回的是一个数组 $snoopy->error //返回报错信息 ?>
相關視頻推薦:PHP編程從入門到精通
以上是php snoopy用法是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本文比較了酸和基本數據庫模型,詳細介紹了它們的特徵和適當的用例。酸優先確定數據完整性和一致性,適合財務和電子商務應用程序,而基礎則側重於可用性和

本文討論了確保PHP文件上傳的確保,以防止諸如代碼注入之類的漏洞。它專注於文件類型驗證,安全存儲和錯誤處理以增強應用程序安全性。

本文討論了在PHP中實施API速率限制的策略,包括諸如令牌桶和漏水桶等算法,以及使用Symfony/Rate-limimiter之類的庫。它還涵蓋監視,動態調整速率限制和手

本文討論了使用password_hash和pyspasswify在PHP中使用密碼的好處。主要論點是,這些功能通過自動鹽,強大的哈希算法和SECH來增強密碼保護

本文討論了OWASP在PHP和緩解策略中的十大漏洞。關鍵問題包括注射,驗證損壞和XSS,並提供用於監視和保護PHP應用程序的推薦工具。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

Atom編輯器mac版下載
最受歡迎的的開源編輯器

Dreamweaver Mac版
視覺化網頁開發工具