>  기사  >  백엔드 개발  >  simple_html_dom.php 的使用

simple_html_dom.php 的使用

WBOY
WBOY원래의
2016-06-23 14:30:321345검색

simple_html_dom.php 可以说使用PHP处理 网页, html 还可以.

 

不过, 与java 处理 不同的网页编码一样,  对不同的编码并没有进行处理,  已进行了改进. 以下是使用方法:
(说明: 目前只修改为读取 UTF8 或 gb2312 网页.)

 

在 g/fw.php 中, 以下定义与 simple_html_dom 有关:

$MY_HTML_CONV = "utf8->gb";  // 这是读取UTF8编码时的设置.

$IS_CURL = true;     // 使用 curl 读取,  还是使用 file_get_contents读取网页.

$IS_CONV = true;   // 使用 iconv() 还是使用 mb_convert_encoding 进行转码  

---------------------------------------------------------------------------------

注:  如果在一个函数中, 要读取gb2312 的编码, 而已经在 $MY_HTML_CONV 中指定的是读取 UTF8 编码的话, 要使用如下:

include('simplehtmldom/simple_html_dom.php');

 

// 读取 GB2312 的网页内容.
$GLOBALS['MY_HTML_CONV'] = null;  // 注: 这行是为了修改在 g/fw.php 中已定义的值.
$html = str_get_html($ct);

---------------------------------------------------------------------------------

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
이전 기사:php注释标准다음 기사:隐藏index.php