ホームページ >バックエンド開発 >PHPチュートリアル >訪問者が検索エンジンのスパイダーであるかどうかを判断する Maopu の人肉検索エンジンの PHP 関数コード

訪問者が検索エンジンのスパイダーであるかどうかを判断する Maopu の人肉検索エンジンの PHP 関数コード

WBOY
WBOYオリジナル
2016-07-29 08:46:202727ブラウズ

复制代代码如下:


/**
* 検索エンジン スパイダーかどうかを判断します
*
* @author Eddy
* @return bool
*/
function isCrawler() {
$agent= strto lower($_SERVER['HTTP_USER_AGENT']);
if (!empty($agent)) {
$spiderSite= array(
"TencentTraveler",
"Baiduspider+",
"BaiduGame",
"Googlebot",
"msnbot",
"Sosospider+",
"Sogouウェブ スパイダー"、
"ia_archiver"、
"Yahoo! Slurp"、
"YoudaoBot"、
"Yahoo Slurp"、
"MSNBot"、
"Java (多くの場合スパム ボット)"、
"BaiDuSpider"、
"Voila "、
"Yandex ボット"、
"BSpider"、
"twiceler"、
"Sogou Spider"、
"Speedy Spider"、
"Google AdSense"、
"Heritrix"、
"Python-urllib"、
" Alexa (IA Archiver)」、
「Ask」、
「Exabot」、
「Custo」、
「OutfoxBot/YodaoBot」、
「yacy」、
「SurveyBot」、
「legs」、
「lwp-trivial」 、
「Nutch」、
「StackRambler」、
「Web アーカイブ (IA Archiver)」、
「Perl ツール」、
「MJ12bot」、
「Netcraft」、
「MSIECrawler」、
「WGet ツール」、
"ラルビン"、
"魚の検索"、
);
foreach($spiderSite as $val) {
$str = strto lower($val);
if (strpos($agent, $str) !== false) {
return true;
}
}
} else {
return false;
}
}


网上是能搜到一大把,不过都是千篇一律的复制,复制去的,也不够全面,我这里整理了一份比较全面的代码:

复制代代码如下:


function is_spider(){
$robot = 0;
$USER_AGENT = strto lower($_SERVER['HTTP_USER_AGENT']);
if(strpos($USER_AGENT,"ボット")) $robot = 1;
if(strpos($USER_AGENT,"スパイダー")) $robot = 1;
if(strpos($USER_AGENT,"slurp")) $robot = 1;
if(strpos($USER_AGENT,"mediapartners-google")) $robot = 1;
if(strpos($USER_AGENT,"fast-webcrawler")) $robot = 1;
if(strpos($USER_AGENT,"altavista")) $robot = 1;
if(strpos($USER_AGENT,"ia_archiver")) $robot = 1;
if($robot == 1){
//何かをする
}
return '';
}

以上、猫の男の人肉インデックス擎 php は、ゲストがインデックス クローラーの関数コードであるかどうかを判断し、猫の男の人肉インデックス擎に関する内容を含み、PHP 教育に興味のある友人の助けになることを望んでいます。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。