搜尋
首頁php教程php手册通过PHP程序知道蜘蛛是否访问你的网站(附代码)

搜索引擎的蜘蛛访问网站是通过远程抓取页面来进行的,我们不能使用JS代码来取得蜘蛛的Agent信息,但是我们可以通过image标签,这样我们就可以得到蜘蛛的agent资料了,通过对agent资料的分析,就可以确定蜘蛛的种类、性别等因素,我们在通过数据库或者文本来记录就可以进行统计了。

数据库结构:

# 
# 表的结构 `naps_stats_bot` 
# 
 
CREATE TABLE `naps_stats_bot` ( 
`botid` int(10) unsigned NOT NULL auto_increment, 
`botname` varchar(100) NOT NULL default '', 
`botagent` varchar(200) NOT NULL default '', 
`bottag` varchar(100) NOT NULL default '', 
`botcount` int(11) NOT NULL default '0', 
`botlast` datetime NOT NULL default '0000-00-00 00:00:00', 
`botlasturl` varchar(250) NOT NULL default '', 
UNIQUE KEY `botid` (`botid`), 
KEY `botname` (`botname`) 
) TYPE=MyISAM AUTO_INCREMENT=9 ; 
 
# 
# 导出表中的数据 `naps_stats_bot` 
# 
 
INSERT INTO `naps_stats_bot` VALUES (1, 'Googlebot', 'Googlebot/2.X ( http://www.googlebot.com/bot.html)', 'googlebot', 0, '0000-00-00 00:00:00', ''); 
INSERT INTO `naps_stats_bot` VALUES (2, 'MSNbot', 'MSNBOT/0.1 (http://search.msn.com/msnbot.htm)', 'msnbot', 0, '0000-00-00 00:00:00', ''); 
INSERT INTO `naps_stats_bot` VALUES (3, 'Inktomi Slurp', 'Slurp/2.0', 'slurp', 0, '0000-00-00 00:00:00', ''); 
INSERT INTO `naps_stats_bot` VALUES (4, 'Baiduspider', 'Baiduspider ( http://www.baidu.com/search/spider.htm)', 'baiduspider', 0, '0000-00-00 00:00:00', ''); 
INSERT INTO `naps_stats_bot` VALUES (5, 'Yahoobot', 'Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)', 'slurp', 0, '0000-00-00 00:00:00', ''); 
INSERT INTO `naps_stats_bot` VALUES (6, 'Sohubot', 'sohu-search', 'sohu-search', 0, '0000-00-00 00:00:00', ''); 
INSERT INTO `naps_stats_bot` VALUES (7, 'Lycos', 'Lycos/x.x', 'lycos', 0, '0000-00-00 00:00:00', ''); 
INSERT INTO `naps_stats_bot` VALUES (8, 'Robozilla', 'Robozilla/1.0', 'robozilla', 0, '0000-00-00 00:00:00', '');

PHP程序:

<?php
error_reporting(E_ALL & ~E_NOTICE);
function get_naps_bot() {
    $useragent = strtolower($_SERVER[&#39;HTTP_USER_AGENT&#39;]);
    if (strpos($useragent, &#39;googlebot&#39;) !== false) {
        return &#39;Googlebot&#39;;
    }
    if (strpos($useragent, &#39;msnbot&#39;) !== false) {
        return &#39;MSNbot&#39;;
    }
    if (strpos($useragent, &#39;slurp&#39;) !== false) {
        return &#39;Yahoobot&#39;;
    }
    if (strpos($useragent, &#39;baiduspider&#39;) !== false) {
        return &#39;Baiduspider&#39;;
    }
    if (strpos($useragent, &#39;sohu-search&#39;) !== false) {
        return &#39;Sohubot&#39;;
    }
    if (strpos($useragent, &#39;lycos&#39;) !== false) {
        return &#39;Lycos&#39;;
    }
    if (strpos($useragent, &#39;robozilla&#39;) !== false) {
        return &#39;Robozilla&#39;;
    }
    return false;
}
$tlc_thispage = addslashes($_SERVER[&#39;HTTP_USER_AGENT&#39;]);
//添加蜘蛛的抓取记录
$searchbot = get_naps_bot();
if ($searchbot) {
    $DB_naps->query("UPDATE naps_stats_bot SET botcount=botcount 1, botlast=NOW(), botlasturl=&#39;$tlc_thispage&#39; WHERE botname=&#39;$searchbot&#39;");
}
?>


本文地址:

转载随意,但请附上文章地址:-)

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具