>백엔드 개발 >PHP 튜토리얼 >可否帮忙写一个单页页的PHP采集程序,并附上实例,该怎么解决

可否帮忙写一个单页页的PHP采集程序,并附上实例,该怎么解决

WBOY
WBOY원래의
2016-06-13 10:28:121105검색

可否帮忙写一个单页页的PHP采集程序,并附上实例
比方说,我要采集这个页面:http://news.163.com/12/0613/20/83TJ7PA700014JB6.html

要求:
采集标题
采集正文

谢谢!

------解决方案--------------------
首先去http://simplehtmldom.sourceforge.net/index.htm(点击Download latest version form Sourceforge.)下载一个simple_html_dom.php,傻瓜式的正则,另官网上有详细教程,很容易看懂。

PHP code
header("Content-type: text/html; charset=gb2312");require dirname(__FILE__) . '/simple_html_dom.php';$ch = curl_init();curl_setopt($ch, CURLOPT_URL, 'http://news.163.com/12/0613/20/83TJ7PA700014JB6.html');curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');$htmls = curl_exec($ch);curl_close($ch);$html = str_get_html($htmls);foreach($html->find('#h1title') as $title){        echo strip_tags($title).'<br>';//标题}foreach($html->find('#endText') as $content){     echo strip_tags($content);//正文}<br><font color="#e78608">------解决方案--------------------</font><br>PHP获取QQ邮箱好友列表的方法:<br><font color="#e78608">------解决方案--------------------</font><br>用抓取页面就可以,标题的话就是title标签之间的,正文是body之间的,用正则去掉一些不需要的内容<div class="clear">
                 
              
              
        
            </div>
성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.