ホームページ >バックエンド開発 >PHPチュートリアル >クロールと分析_PHP チュートリアル

クロールと分析_PHP チュートリアル

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル
2016-07-13 17:25:06895ブラウズ

ファイルのクロールと分析は非常に簡単です。このチュートリアルでは、それを実装するための例を段階的に説明します。はじめましょう!

まず、どの URL アドレスをクロールするかを決定する必要があります。これはスクリプトで設定するか、$QUERY_STRING 経由で渡すことができます。簡単にするために、変数をスクリプト内で直接設定しましょう。


$url = http://www.php.net;
?>

2 番目のステップは、指定されたファイルを取得し、file() 関数を通じて配列に保存することです。


$url = http://www.php.net;
$lines_array = file($url);

これで、配列にファイルができました。ただし、分析したいテキストがすべて 1 行に収まるわけではありません。このファイルを解決するには、配列 $lines_array を文字列に変換するだけです。これを実現するには、implode(x,y) 関数を使用します。後で爆発(文字列変数の配列)を使用したい場合は、x を「|」または「!」またはその他の同様の区切り文字に設定することをお勧めします。ただし、今回の目的では、x をスペースに設定するのが最善です。 y は、implode() で処理する配列であるため、もう 1 つの必須パラメータです。


$url = http://www.php.net;
$lines_string = implode(, $lines_array); さて、クロール作業は次のとおりです。それが完了したら、分析を始めます。この例では、

の間のすべてを取得したいと考えています。文字列を解析するには、正規表現と呼ばれるものも必要です。


$url = http://www.php.net;
$lines_string = implode("

(.*)") , $lines_string, $head);





?> コードを見てみましょう。ご覧のとおり、eregi() 関数は次の形式で実行されます。 「と最後に、データを入力します。
の間のすべてを分析する」と解釈されます。 $lines_string は分析対象の文字列、$head は分析結果が格納される配列です。

の間にはインスタンスが 1 つだけあるため、配列には要素が 1 つだけあると想定できます。これが私たちが望むものです。印刷してみましょう。


$url = http://www.php.net;
$lines_string = implode("(.*)") , $lines_string, $head);
echo $head[0];
?> これがコードのすべてです。

WeberDev.comから転載

http://www.bkjia.com/PHPjc/532087.html

www.bkjia.com

tru​​ehttp://www.bkjia.com/PHPjc/532087.html

技術記事

ファイルのクロールと分析は非常に簡単です。このチュートリアルでは、それを実装するための例を段階的に説明します。はじめましょう! まず、私の長官が何を逮捕するかを決めなければなりません...

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。