ホームページ  >  記事  >  バックエンド開発  >  PHP は検索エンジン クロール コード共有を実装します

PHP は検索エンジン クロール コード共有を実装します

小云云
小云云オリジナル
2018-03-03 09:28:511641ブラウズ

この記事では主に検索エンジンのクローリング記録を記録するためのPHPの実装コードを紹介し、次に各検索スパイダーのクローリング記録を取得するためのPHPのコードを紹介します。

以下は完全なコードです:

//记录搜索引擎爬行记录 $searchbot = get_naps_bot(); 
if ($searchbot) 
{ $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); 
$url = $_SERVER['HTTP_REFERER']; 
$file = WEB_PATH.'robotslogs.txt'; 
$date = date('Y-m-d H:i:s'); 
$data = fopen($file,'a'); 
fwrite($data,"Time:$date robot:$searchbot URL:$tlc_thispage/r/n"); 
fclose($data);
}

WEB_PATH は、index.PHP の下にある定義のルート ディレクトリ パスです。これは、robotslogs.txt ファイルがルート ディレクトリに配置されることを意味します。

get_naps_bot() を通じてスパイダー クローリング レコードを取得し、addslashes を通じて処理し、変数 $tlc_thispage にデータを保存します。

fopen は robotslogs.txt ファイルを開き、関数 fwrite を通じてデータを書き込み、関数 fclose を通じてファイルを閉じます。

必要ないと思ったのでホームページ上のコードを削除したため、効果例はありません。

追記: 各検索スパイダーのクロール記録を取得するための PHP コード

次の検索エンジンをサポートしています: Baidu、Google、Bing、Yahoo、Soso、Sogou、Yodao のクロール Web サイト記録

コード:

<?php 
/**
* 获取搜索引擎爬行记录
* edit by www.jb51.net
*/
function get_naps_bot() 
{ 
$useragent = strtolower($_SERVER[&#39;HTTP_USER_AGENT&#39;]); 
if (strpos($useragent, &#39;googlebot&#39;) !== false){ 
return &#39;Google&#39;; 
} 
if (strpos($useragent, &#39;baiduspider&#39;) !== false){ 
return &#39;Baidu&#39;; 
} 
if (strpos($useragent, &#39;msnbot&#39;) !== false){ 
return &#39;Bing&#39;; 
} 
if (strpos($useragent, &#39;slurp&#39;) !== false){ 
return &#39;Yahoo&#39;; 
} 
if (strpos($useragent, &#39;sosospider&#39;) !== false){ 
return &#39;Soso&#39;; 
} 
if (strpos($useragent, &#39;sogou spider&#39;) !== false){ 
return &#39;Sogou&#39;; 
} 
if (strpos($useragent, &#39;yodaobot&#39;) !== false){ 
return &#39;Yodao&#39;; 
} 
return false; 
} 
function nowtime(){ 
$date=date("Y-m-d.G:i:s"); 
return $date; 
} 
$searchbot = get_naps_bot(); 
if ($searchbot) { 
$tlc_thispage = addslashes($_SERVER[&#39;HTTP_USER_AGENT&#39;]); 
$url=$_SERVER[&#39;HTTP_REFERER&#39;]; 
$file="www.jb51.net.txt"; 
$time=nowtime(); 
$data=fopen($file,"a"); 
fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n"); 
fclose($data); 
} 
?>

関連する推奨事項:

jQuery Jsonp クロスドメインのシミュレートされた検索エンジンのサンプルの共有

php 既存の検索エンジンへの呼び出しの詳細な説明

JavaScript で検索エンジンのナビゲーション Web 検索ボックスを切り替える方法のサンプル コードの共有

以上がPHP は検索エンジン クロール コード共有を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。