>  기사  >  백엔드 개발  >  PHP는 tidy_parse_file() 함수를 사용하여 HTML의 링크를 추출합니다.

PHP는 tidy_parse_file() 함수를 사용하여 HTML의 링크를 추출합니다.

WBOY
WBOY원래의
2016-07-25 09:11:28976검색
  1. function dump_urls(tidy_node $node, &$urls = NULL) {
  2. $urls = (is_array($urls)) ? $urls : array();
  3. if(isset($node->id)) {
  4. if($node->id == TIDY_TAG_A) {
  5. $urls[] = $node->attribute['href'];
  6. }
  7. }
  8. if($node->hasChildren()) {
  9. foreach($node->child as $child) {
  10. dump_urls($child, $urls);
  11. }
  12. }
  13. return $urls;
  14. }
  15. $tidy = tidy_parse_file("http://www.php.net/");
  16. $urls = dump_urls($tidy->body());
  17. print_r($urls);
  18. ?>
复制代码


성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.