ホームページ  >  記事  >  バックエンド開発  >  PHP は Tidy_parse_file() 関数を使用して HTML 内のリンクを抽出します

PHP は Tidy_parse_file() 関数を使用して HTML 内のリンクを抽出します

WBOY
WBOYオリジナル
2016-07-25 09:11:28939ブラウズ
  1. function dump_urls(tidy_node $node, &$urls = NULL) {
  2. $urls = (is_array($urls)) ? $urls : array();
  3. if(isset($node->id)) {
  4. if($node->id == TIDY_TAG_A) {
  5. $urls[] = $node->attribute[' href'];
  6. }
  7. }
  8. if($node->hasChildren()) {
  9. foreach($node->child as $child) {
  10. dump_urls($child, $urls);
  11. }
  12. }
  13. return $urls;
  14. }
  15. $tidy = tiny_parse_file("http://www.php.net/");
  16. $urls = dump_urls($tidy->body());
  17. print_r($urls) ;
  18. ?>
复制代


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。