搜尋
首頁後端開發PHP問題php snoopy用法是什麼

php snoopy用法是什麼

Mar 11, 2021 pm 05:54 PM
phpsnoopy

php snoopy用法:1、【fetch($URI)】為了抓取網頁的內容;2、【fetchtext($URI)】移除HTML標籤和其他的無關資料;3、【fetchform($ URI)】返回網頁中表單內容。

php snoopy用法是什麼

本教學操作環境:windows7系統、PHP5.6版,DELL G3電腦。

php snoopy用法:

Snoopy類別方法與範例:

1、fetch($URI)

這是為了抓取網頁的內容而使用的方法。

$URI參數是被抓取網頁的URL位址。

抓取的結果被儲存在 $this->results 中。

如果你正在抓取的是一個框架,Snoopy會將每個框架追蹤後存入數組中,然後存入 $this->results。

2、fetchtext($URI)

本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只返回網頁中的文字內容。

3、fetchform($URI)

本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只返回網頁中表單內容(form)。

4、fetchlinks($URI)

本方法類似fetch(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只返回網頁中連結(link)。

預設情況下,相對連結會自動補全,轉換成完整的URL。

5、submit($URI,$formvars)

#本方法傳送確認表單給$URL指定的連結位址。 $formvars是一個儲存表單參數的陣列。

6、submittext($URI,$formvars)

本方法類似submit(),唯一不同的就是本方法會移除HTML標籤和其他的無關數據,只回傳登陸後網頁中的文字內容。

7、submitlinks($URI)

本方法類似submit(),唯一不同的是本方法會移除HTML標籤和其他的無關數據,只返回網頁中連結(link)。

預設情況下,相對連結會自動補全,轉換成完整的URL。

Snoopy擷取類別屬性: (預設值在括號裡)

#$host 連線的主機

#$port 連線的連接埠

$proxy_host 使用的代理主機,如果有的話

$proxy_port 使用的代理主機端口,如果有的話

$agent 用戶代理偽裝(Snoopy v0.1 )

$referer 來路信息,如果有的話

$cookies cookies 如果有的話

$rawheaders 其他的頭資訊, 如果有的話

$maxredirs 最大重定向次數, 0=不允許(5)

$offsiteok whether or not to allow redirects off-site. (true)

$expandlinks 是否將連結都補全為完整位址(true)

$user 認證使用者名稱, 如果有的話

$pass 認證使用者名稱, 如果有的話

$accept http 接受類型(image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, */*)

$error 哪裡報錯, 如果有的話

$response_code 從伺服器傳回的回應代碼

$headers 從伺服器返回的頭資訊

$maxlength 最長返回資料長度

$read_timeout 讀取操作逾時(requires PHP 4 Beta 4 ) 設定為0為沒有逾時

$timed_out 如果一次讀取操作逾時了,本屬性回傳true (requires PHP 4 Beta 4 )

$maxframes 允許追蹤的框架最大數量

$status 抓取的http的狀態

$temp_dir 網頁伺服器能夠寫入的暫存檔案目錄(/tmp)

$curl_path cURL binary 的目錄, 如果沒有cURL binary就設定為false

下面是一個範例:

程式碼如下:

include "Snoopy.class.php";
 $snoopy = new Snoopy;
 
 $snoopy->proxy_host = "https://www.jb51.net";
 $snoopy->proxy_port = "80";
 
 $snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)";
 $snoopy->referer = "https://www.jb51.net";
 
 $snoopy->cookies["SessionID"] = 238472834723489l;
 $snoopy->cookies["favoriteColor"] = "RED";
 
 $snoopy->rawheaders["Pragma"] = "no-cache";
 
 $snoopy->maxredirs = 2;
 $snoopy->offsiteok = false;
 $snoopy->expandlinks = false;
 
 $snoopy->user = "joe";
 $snoopy->pass = "bloe";
 
 if($snoopy->fetchtext("https://www.jb51.net"))
 {
 echo "<PRE>".htmlspecialchars($snoopy->results)."
\n";  }  else  echo "error fetching document: ".$snoopy->error."\n";

取得指定url內容

程式碼如下:

<?php
 $url = "https://www.jb51.net";
 include("snoopy.php");
 $snoopy = new Snoopy;
 $snoopy->fetch($url); //获取所有内容
 echo $snoopy->results; //显示结果
 //可选以下
 $snoopy->fetchtext //获取文本内容(去掉html代码)
 $snoopy->fetchlinks //获取链接
 $snoopy->fetchform  //获取表单
 ?>

表單提交

程式碼如下:

<?php
$formvars["username"] = "admin";
$formvars["pwd"] = "admin";
$action = "https://www.jb51.net";//</a>表单提交地址
$snoopy->submit($action,$formvars);//$formvars为提交的数组
echo $snoopy->results; //获取表单提交后的 返回的结果
//可选以下
$snoopy->submittext; //提交后只返回 去除html的 文本
$snoopy->submitlinks;//提交后只返回 链接
?>

既然已經提交的表單那就可以做很多事情接下來我們來偽裝ip,偽裝瀏覽器

偽裝瀏覽器

程式碼如下:

<?php
$formvars["username"] = "lanfengye";
$formvars["pwd"] = "lanfengye";
$action = "https://www.jb51.net";
include "snoopy.php";
$snoopy = new Snoopy;
$snoopy->cookies["PHPSESSID"] = &#39;fc106b1918bd522cc863f36890e6fff7&#39;; //伪装sessionid
$snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)"; //伪装浏览器
$snoopy->referer = "https://www.jb51.net"; //伪装来源页地址 http_referer
$snoopy->rawheaders["Pragma"] = "no-cache"; //cache 的http头信息
$snoopy->rawheaders["X_FORWARDED_FOR"] = "127.0.0.101"; //伪装ip
$snoopy->submit($action,$formvars);
echo $snoopy->results;
?>

原來我們可以偽裝session 偽裝瀏覽器,偽裝ip, haha​​ 可以做很多事情了。

例如:帶驗證碼,驗證ip 投票, 可以不停的投。

ps:這裡偽裝ip ,其實是偽裝http頭, 所以一般的透過REMOTE_ADDR 取得的ip是偽裝不了,反而那些透過http頭來取得ip的(可以防止代理的那種) 就可以自己來製造ip。

關於如何驗證碼,簡單說下:

首先用普通的瀏覽器, 查看頁面, 找到驗證碼所對應的sessionid,同時記下sessionid和驗證碼值,接下來就用snoopy去偽造。

原理:由於是同一個sessionid 所以取得的驗證碼和第一次輸入的是一樣的。

有時我們可能需要偽造更多的東西,snoopy完全為我們想到了

<?php
$snoopy->proxy_host = "https://www.jb51.net";
$snoopy->proxy_port = "8080"; //使用代理
$snoopy->maxredirs = 2; //重定向次数
$snoopy->expandlinks = true; //是否补全链接 在采集的时候经常用到
// 例如链接为 /images/taoav.gif 可改为它的全链接 <a href="https://www.jb51.net/images/taoav.gif">https://www.jb51.net/images/taoav.gif</a>
$snoopy->maxframes = 5 //允许的最大框架数
//注意抓取框架的时候 $snoopy->results 返回的是一个数组
$snoopy->error //返回报错信息
?>

相關視頻推薦:PHP編程從入門到精通

以上是php snoopy用法是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
酸與基本數據庫:差異和何時使用。酸與基本數據庫:差異和何時使用。Mar 26, 2025 pm 04:19 PM

本文比較了酸和基本數據庫模型,詳細介紹了它們的特徵和適當的用例。酸優先確定數據完整性和一致性,適合財務和電子商務應用程序,而基礎則側重於可用性和

PHP安全文件上傳:防止與文件相關的漏洞。PHP安全文件上傳:防止與文件相關的漏洞。Mar 26, 2025 pm 04:18 PM

本文討論了確保PHP文件上傳的確保,以防止諸如代碼注入之類的漏洞。它專注於文件類型驗證,安全存儲和錯誤處理以增強應用程序安全性。

PHP輸入驗證:最佳實踐。PHP輸入驗證:最佳實踐。Mar 26, 2025 pm 04:17 PM

文章討論了PHP輸入驗證以增強安全性的最佳實踐,重點是使用內置功能,白名單方法和服務器端驗證等技術。

PHP API率限制:實施策略。PHP API率限制:實施策略。Mar 26, 2025 pm 04:16 PM

本文討論了在PHP中實施API速率限制的策略,包括諸如令牌桶和漏水桶等算法,以及使用Symfony/Rate-limimiter之類的庫。它還涵蓋監視,動態調整速率限制和手

php密碼哈希:password_hash和password_verify。php密碼哈希:password_hash和password_verify。Mar 26, 2025 pm 04:15 PM

本文討論了使用password_hash和pyspasswify在PHP中使用密碼的好處。主要論點是,這些功能通過自動鹽,強大的哈希算法和SECH來增強密碼保護

OWASP前10 php:描述並減輕常見漏洞。OWASP前10 php:描述並減輕常見漏洞。Mar 26, 2025 pm 04:13 PM

本文討論了OWASP在PHP和緩解策略中的十大漏洞。關鍵問題包括注射,驗證損壞和XSS,並提供用於監視和保護PHP應用程序的推薦工具。

PHP XSS預防:如何預防XSS。PHP XSS預防:如何預防XSS。Mar 26, 2025 pm 04:12 PM

本文討論了防止PHP中XSS攻擊的策略,專注於輸入消毒,輸出編碼以及使用安全增強的庫和框架。

PHP接口與抽像類:何時使用。PHP接口與抽像類:何時使用。Mar 26, 2025 pm 04:11 PM

本文討論了PHP中接口和抽像類的使用,重點是何時使用。界面定義了無實施的合同,適用於無關類和多重繼承。摘要類提供常見功能

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具