この記事では主に検索エンジンのクローリング記録を記録するためのPHPの実装コードを紹介し、次に各検索スパイダーのクローリング記録を取得するためのPHPのコードを紹介します。
以下は完全なコードです:
//记录搜索引擎爬行记录 $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url = $_SERVER['HTTP_REFERER']; $file = WEB_PATH.'robotslogs.txt'; $date = date('Y-m-d H:i:s'); $data = fopen($file,'a'); fwrite($data,"Time:$date robot:$searchbot URL:$tlc_thispage/r/n"); fclose($data); }
WEB_PATH は、index.PHP の下にある定義のルート ディレクトリ パスです。これは、robotslogs.txt ファイルがルート ディレクトリに配置されることを意味します。
get_naps_bot() を通じてスパイダー クローリング レコードを取得し、addslashes を通じて処理し、変数 $tlc_thispage にデータを保存します。
fopen は robotslogs.txt ファイルを開き、関数 fwrite を通じてデータを書き込み、関数 fclose を通じてファイルを閉じます。
必要ないと思ったのでホームページ上のコードを削除したため、効果例はありません。
追記: 各検索スパイダーのクロール記録を取得するための PHP コード
次の検索エンジンをサポートしています: Baidu、Google、Bing、Yahoo、Soso、Sogou、Yodao のクロール Web サイト記録
コード:
<?php /** * 获取搜索引擎爬行记录 * edit by www.jb51.net */ function get_naps_bot() { $useragent = strtolower($_SERVER['HTTP_USER_AGENT']); if (strpos($useragent, 'googlebot') !== false){ return 'Google'; } if (strpos($useragent, 'baiduspider') !== false){ return 'Baidu'; } if (strpos($useragent, 'msnbot') !== false){ return 'Bing'; } if (strpos($useragent, 'slurp') !== false){ return 'Yahoo'; } if (strpos($useragent, 'sosospider') !== false){ return 'Soso'; } if (strpos($useragent, 'sogou spider') !== false){ return 'Sogou'; } if (strpos($useragent, 'yodaobot') !== false){ return 'Yodao'; } return false; } function nowtime(){ $date=date("Y-m-d.G:i:s"); return $date; } $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url=$_SERVER['HTTP_REFERER']; $file="www.jb51.net.txt"; $time=nowtime(); $data=fopen($file,"a"); fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n"); fclose($data); } ?>
関連する推奨事項:
jQuery Jsonp クロスドメインのシミュレートされた検索エンジンのサンプルの共有
JavaScript で検索エンジンのナビゲーション Web 検索ボックスを切り替える方法のサンプル コードの共有
以上がPHP は検索エンジン クロール コード共有を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。