>  기사  >  백엔드 개발  >  스누피 클래스를 사용하여 HTML 파일을 구문 분석하는 방법

스누피 클래스를 사용하여 HTML 파일을 구문 분석하는 방법

墨辰丷
墨辰丷원래의
2018-06-08 17:39:301572검색

이 글에서는 주로 스누피를 기반으로 웹페이지 HTML을 구문 분석하는 방법을 소개합니다. 예제에서는 HTML 파일을 구문 분석하기 위해 스누피 클래스를 사용하는 관련 기술을 분석합니다. 필요한 친구는 이를 참조할 수 있습니다. 이 글의 예시는 스누피를 기반으로 하는 PHP의 이야기를 담고 있으며, 웹페이지 html을 파싱하는 방법, 구체적인 구현 방법은 다음과 같습니다.

set_time_limit(0);
$user = array('20517', '20518');
header("content-Type: text/html; charset=utf-8");
require_once './Snoopy.php';
$snoopy = new Snoopy();
//$uri = 'http://www.juzimi.com/meitumeiju';
$uri = 'http://www.juzimi.com/meitumeiju?page=1';
$snoopy->fetch($uri);
$con = $snoopy->getResults();
$doc = new DOMDocument();
$doc->loadHTML($con);
/* make a result array ... */
$result = [];
/* go through all nodes which have class="baby" ... */
$i = 0;
foreach( ( new DOMXPath( $doc ) )->query( '//*[@id="bdshare"]' ) as $element ) {
  $row = $doc->saveHTML($element);
  $start = stripos($row, '{');
  $end = stripos($row, '}');
  $len = $end - $start + 1;
  $json = substr($row, $start, $len);
  $json = str_replace("'", '"', $json);
  $obj = json_decode($json);
  $pic = $obj->pic;
  $desc = $obj->desc;
  $filename = '/Uploads/meiju/card' . date('ymdhis') . $i . '.png';
  $file = '/alidata/www/test' . $filename;
  $image = file_get_contents($pic);
  file_put_contents($file, $image);
}

요약:

위 내용은 이 글의 전체 내용입니다. 모든 사람의 학습에 도움이 됩니다.

관련 권장 사항:

PHP+Mysql+jQuery는 현재 온라인 사용자 수를 계산합니다.

PHP+Mysql+jQuery는 쿼리 및 목록 상자 선택을 구현합니다.

php는 3마다 숫자로 숫자 서식을 구현합니다. 숫자 쉼표를 추가하는 함수 함수

위 내용은 스누피 클래스를 사용하여 HTML 파일을 구문 분석하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.