ホームページ >php教程 >php手册 >php情報収集プログラムコード

php情報収集プログラムコード

WBOY
WBOYオリジナル
2016-06-13 12:24:50815ブラウズ

コードをコピーします コードは次のとおりです:


<
//ホームページのアドレスを収集します
$url ="http:///emotion.pclady.com.cn/skills/";
//ページ コードを取得します
$rs=file_get_contents($url)
//一致する通常のルールを設定します
//$fp=fopen ("text.txt","a");
//$fw=fwrite($fp,$rs);
//fclose($fp); /*href="http://emotion.pclady.com.cn/skills/0903/376476.html"
target=_blank>善人を維持するあなたの側
*/
$preg='/(.*)< ;/a>< /i>/i';
//通常の検索を実行します
preg_match_all($preg,$rs,$title);
//タイトルの数を計算しますcount=count($title[0 ]);
echo $count."
";
//タイトル数ごとにコンテンツを収集します
for ($i=0;$i
//コンテンツ ページのアドレスを設定します
$pr='//isU';
preg_match_all($) pr,$title[0][ $i],$jurl);
$substr=substr($jurl[0][0],9);
$curl=substr($substr,0,- 18);
// コンテンツ ページ コードを取得します
$c=file_get_contents($curl);
//通常のルールに一致するコンテンツ ページを設定します
$pc='//i ';
//通常の一致検索を実行します
preg_match($pc,$c,$content);
//タイトルを出力します
echo $title[0 ][$i]."
";
echo $title[1][$i]."
$concount=count($content[0]); 🎜>echo $concount."< br>";
echo $content[0][0];
for ($j=0;$j
}
}
?>


検出後、$c はすでにコンテンツ ページのデータ ストリームですが、$pc の正規表現が < にのみ一致するのはなぜですか; 文字だけで、上記の subsrt() 関数を使用したためですか?他に何が問題ですか?アドバイスをいただけますか?

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。