define('ISROBOT', getrobot());if(defined('NOROBOT') && ISROBOT) { exit(header("HTTP/1.1 403 Forbidden"));}
function getrobot() { if(!defined('IS_ROBOT')) { $kw_spiders = 'Bot|Crawl|Spider|slurp|sohu-search|lycos|robozilla'; $kw_browsers = 'MSIE|Netscape|Opera|Konqueror|Mozilla'; if(preg_match("/($kw_browsers)/", $_SERVER['HTTP_USER_AGENT'])) { define('IS_ROBOT', FALSE); } elseif(preg_match("/($kw_spiders)/", $_SERVER['HTTP_USER_AGENT'])) { define('IS_ROBOT', TRUE); } else { define('IS_ROBOT', FALSE); } } return IS_ROBOT;}
ボット - Microsoft の bing
Spider-Baidu
slurp - Yahoo
他のものについてはわかりませんが、これは通常のクロールを防止するだけであり、防止できない可能性があります誰かが偽造したら
ボット - Microsoft の bing
Spider - Baidu
slurp - Yahoo
他のものについては知りませんが、これは通常のクロールを防ぐことができるだけで、誰かが偽造した場合は防止できない可能性があります
不正者を捕まえるためにできることは何もありませんが、一般的な検索エンジンはロボットのプロトコルに従います
不正者を捕まえるためにできることは何もありませんが、一般的な検索エンジンはロボットに従いますプロトコル
Bot|Crawl|Spider|slurp|lycos|robozilla
は、次のパターンです。正規表現によって照合されます
ボット、スパイダー... はすべてスパイダーのロゴであり、ほとんどの検索エンジンは次のように書きます