PHP用DOM方式处理HTML之Simple HTML DOM-php手册-PHP中文网

首页

php教程

php手册

PHP用DOM方式处理HTML之Simple HTML DOM

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 25, 2016 pm 04:42 PM

domhtmlsimple

近经常需要采集一些网上的数据,发现一个PHP处理HTML的利器 simple html dom,看了一下文档,使用非常方便,关键是能够用CSS选择器来访问DOM树,和jquery相似,实在是难得的利器.

入门级

simple_html_dom插件

用dom处理html文件的利器

使用:加载simple_html_dom.php文件

require_once &#39;simple_html_dom.php&#39;
new simple_html_dom对象
$dom = new simple_html_dom()

加载html:

$dom->load($html);
find()方法
$dom->find(&#39;div.lookLeftname&#39;, 0)->plaintext
class=&#39;lookLeftname&#39;的div中的纯文本
$dom->find(&#39;div.lookLeftname&#39;, 0)->innertext
class=&#39;lookLeftname&#39;的div中的内部文本

完整测试实例,代码如下:

<?php
require_once ("simple_html_dom.php");
ini_set(&#39;memory_limit&#39;, &#39;1000M&#39;);
ini_set("max_execution_time", 6000000);
for ($i = 1; $i <= 21; $i++) {
    $html = file_get_html(http: //www.111cn.net);
        $as = $html->find(&#39;.shopname a&#39;);
        $sum = 0;
        foreach ($as as $a) {
            if ($a->plaintext != "分店") {
                $a->href = "http://www.xx.com" . $a->href;
                echo $a->outertext . "------" . $a->href . "-------<br>";
                $sum++;
            }
        }
        echo "<br><br>第 {$i} 页结束 ，数目：{$sum}<hr>";
    }
?>

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn