ホームページ  >  記事  >  バックエンド開発  >  スパイダーがキャプチャした PHP コードをキャッシュアウトする

スパイダーがキャプチャした PHP コードをキャッシュアウトする

WBOY
WBOYオリジナル
2016-06-13 13:08:261042ブラウズ

スパイダー キャプチャを実装するための PHP コード

SEO (検索エンジン最適化) は、中国語で検索エンジン最適化と訳され、近年人気のあるオンライン マーケティング手法です。主な目的は、特定のキーワードの露出を増やして Web サイトの可視性を高めることです。それにより売上が増加します。オフサイトSEOとオンサイトSEOの2種類に分かれます。 SEOの主な仕事は、さまざまな検索エンジンを理解することです エンジンがインターネット ページをどのようにクロールするか、インデックスを作成する方法、特定のキーワードに対する検索結果のランキングを決定する方法など、Web ページの適切な最適化を実行して検索エンジンのランキングを向上させ、Web サイトを改善します。 トラフィック、そして最終的には Web サイトの販売またはプロモーション機能を向上させるテクノロジーです。

?

多くの人がSEOを行っていますが、 私はよく、なぜ私のページが掲載されていないのか、なぜ私のスナップショットが先週のものなのか、なぜ百度が私のサイトをまだ更新していないのかを尋ねます。これらはすべて、始めたばかりのときに尋ねられる質問です。 SEO を行う人なら誰でも知っている、検索エンジン 運転ルールはとても大切です。スパイダーがあなたのサイトに来たことがあるかどうか、いつここに来たのか、そしてそれがどのスパイダーなのかを知る必要があります。これらは、対象を絞った最適化を行うのに役立ちます。

多くのサーバーはスパイダー クローリング ログをサポートしていますが、ほとんどの Web マスターは仮想マシンであり、一部のスペースはスパイダー クローリングの記録をサポートしていません。この時点で、クモの活動パターンを記録するコードを記述する必要があります。

インターネット上で、正しく使用できないコードや機能が不完全なコードをたくさん見つけました。

自分で調べてください。使用が 100% 保証されているコードのセットを要約します。

<?php

function get_naps_bot()
{

$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);

if (strpos($useragent, ‘googlebot’) !== false){

return ‘Googlebot’;

}

if (strpos($useragent, ‘msnbot’) !== false){

return ‘MSNbot’;

}

if (strpos($useragent, ’slurp’) !== false){

return ‘Yahoobot’;

}

if (strpos($useragent, ‘baiduspider’) !== false){

return ‘Baiduspider’;

}

if (strpos($useragent, ’sohu-search’) !== false){

return ‘Sohubot’;

}

if (strpos($useragent, ‘lycos’) !== false){

return ‘Lycos’;

}

if (strpos($useragent, ‘robozilla’) !== false){

return ‘Robozilla’;

}

return false;

}

function nowtime(){

$date=date(“Y-m-d.G:i:s”);

return $date;

}

$searchbot = get_naps_bot();

if ($searchbot) {

$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);

$url=$_SERVER['HTTP_REFERER'];

$file=”robotslogs.txt”;

$time=nowtime();

$data=fopen($file,”a”);

$PR=”$_SERVER[REQUEST_URI]“;

fwrite($data,”Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n”);

fclose($data);

}

?>

上記のコードには、インターネット上で流通しているバージョンよりも 1 つ多くのページ レコードが含まれており、スパイダーが毎回どのページをクロールするかを確認できます。これは、Web サイト上のスパイダーの重みと、さまざまな列やページへの影響を分析するのに役立ちます。 顔の好意。

SEO の最終目標は、何もないところから物事を想像するのではなく、現実から前進し、データを使って語ることです。すべての最適化の基礎はデータであり、すべての最適化の目的はデータを取得することです。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。