ホームページ  >  記事  >  バックエンド開発  >  ページ情報をクロールするためのPHPの簡単なコード

ページ情報をクロールするためのPHPの簡単なコード

WBOY
WBOYオリジナル
2016-06-13 13:15:21774ブラウズ

ページ情報をクロールするPHPに関する簡単なコード
?php DOM 関数を使用して、単純な単一ページの情報キャプチャを実現します (ここでは a タグのみをキャプチャし、関数は実装されていますが、拡張ページのリンク キャプチャは実装されていません。批判と指導を歓迎します)
error_reporting(E_ERROR);
$pages = file_get_contents('http://www.php100.com');
//$pages = htmlspecialchars($pages);
$doc = new DOMDocument() ;
$new_doc = new DOMDocument('1.0', 'utf-8');
$doc->loadhtml($pages);
$dom = $doc-> getElementsByTagName('a ');
for ($i=0;$i<$dom->length;$i++){
$node = $new_doc->createElement('a',$dom ->item ($i)->nodeValue);
$newnode = $new_doc->appendChild($node);
$newnode->setAttribute('href',$dom-> item($i )->getAttribute('href'));
$newnode->setAttribute('style','display:block;margin-left:30px;');//echo $dom- >item( $i)->getAttribute('src').'
';
}
echo $new_doc->saveHTML();
?>

1階 mj133233 2011-10-11
1階は自分で作ります
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。