本文章来给大家介绍一下关于Simple HTML Dom解析器的使用方法详解,有需要了解的同学不防进入参考。
1. 开始使用
首先下载解压缩,然后将simple_html_dom.php文件包含进要编写的脚本文件中,加载要处理的html,支持三种模式的html加载,分别是『从url中加载,从字符串中加载,从文件中加载』。
代码如下 | 复制代码 |
require_once('simple_html_dom.php'); //从文件中加载 $html = file_get_html('example.htm'); 从字符串加载网上文件需要先从网络下下载,使用cURL比较好一些,需要在php配置文件中打开php扩展php_curl。 $url = 'http://www.111cn.net'; |
2. 查找html元素
使用find函数查找,返回包含对象的数组,常见的查找如下。
代码如下 | 复制代码 |
//查找超链接元素 $alink = $html->find('a'); //查找第n个连接元素 $alink = $html->find('a',5); //查找id为main的div $mainDiv = $html->find('div[id=main]'); //查找所有定义了id的div $idDiv = $html->find('div[id]'); //查找所有定义了id的元素 $idAll = $html->find('[id]'); //查找样式类为info的元素 $classInfo = $html->find('.info'); //支持嵌套子元素查找 $ret = $html->find('ul li'); //查找多个html元素 $ret = $html->find('a,img,p'); //.... |
3. 其他
可以使用内置的函数来进行元素的定位,返回父元素parent,返回子元素数组children,返回第一个子元素first_child,返回最后一个子元素last_child,返回前一个相邻元素prev_sibling,返回后一个相邻元素next_sibling等。
提供简单的正则表达式来过滤属性选择器,类似于[attribute]的格式。
每个对象都有4个基本属性:
tag — 返回html标签名
innertext — 返回innerHTML
outertext — 返回outerHTML
plaintext — 返回HTML标签中的文本
返回元素属性值
//返回$alink的href值
$link = $alink->href;
通过设置元素的属性值可以对元素进行添加、修改、删除操作。
代码如下 | 复制代码 |
//删除url连接 $ret->outertext = ''; $ret->outertext = $ret->outertext . ' other ';$ret->outertext = ' Welcome ' . $ret->outertext; -EOF- |

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。
