PHP 解析 HTML クラス ライブラリ simple_html_dom (詳細な紹介)_PHP チュートリアル
ダウンロード アドレス: https://github.com/samacs/simple_html_dom
パーサーは、HTML ドキュメントの検証に役立つだけでなく、W3C 標準に準拠していない HTML ドキュメントも解析できます。 jQuery に似た要素セレクターを使用して、ID、クラス、タグなどで要素を検索し、ドキュメント ツリーを追加、削除、変更する機能も提供します。もちろん、このような強力な HTML Dom パーサーは完璧ではありません。使用中のメモリ消費には細心の注意が必要です。ただし、この記事では最後にメモリの過剰な消費を避ける方法を説明しますので、ご安心ください。
始めましょう
クラス ファイルをアップロードした後、このクラスを呼び出すには 3 つの方法があります:
URL から HTML ドキュメントをロードする
文字列から HTML ドキュメントをロードする
ファイルから HTML ドキュメントをロードする
// 新しいDomインスタンスを作成します
$html = new simple_html_dom();
// URLからロードします
$html->load_file('http://www .jb51 .net');
// Load
$html->load('文字列から HTML ドキュメントのデモをロード' );
/ /ファイルからロード
$html->load_file('path/file/test.html');
?>
文字列から HTML ドキュメントをロードする場合は、まずインターネットからダウンロードする必要があります。 cURL を使用して HTML ドキュメントを取得し、DOM にロードすることをお勧めします。
HTML 要素を検索する
検索関数を使用して、HTML ドキュメント内の要素を検索できます。返される結果は、オブジェクトを含む配列です。これらのオブジェクトにアクセスするには、HTML DOM 解析クラスの関数を使用します。次に、いくつかの例を示します。
//HTML 内のハイパーリンクを検索します。 document 要素
$a = $html->find('a');
//ドキュメント内の (N) 番目のハイパーリンクを検索し、見つからない場合は空の配列を返します
$a = $html-> ;find ('a', 0);
// ID main を持つ div 要素を検索します
$main = $html->find('div[id=main]',0);
// すべて検索しますid を持つ div 要素を含む要素attribute
$divs = $html->find('div[id]');
// id を含む要素をすべて検索しますattribute
$divs = $html->find('[id ]');
?>
jQuery のようなセレクターを使用して、位置指定された要素を見つけることもできます:
$ret = $html->find('#container');
// class=foo を持つすべての要素を検索
$ret = $html->find('.foo ');
// 複数の HTML タグを検索
$ret = $html->find('a, img');
// このように使うこともできます
$ret = $html->find ('a[title] , img[title]');
?>
パーサーはサブ要素の検索をサポートしています
// ul リスト内のすべてを検索 The li item
$ret = $html->find('ul li');
// ul リスト内で指定された class=selected を持つ li item を検索します
$ ret = $html->find('ul li.selected ');
?>
これを使うのが面倒な場合は、組み込み関数を使用して親要素、子要素を簡単に見つけることができます要素の隣接要素
$e->parent;
// 配列を返します子要素の数
$e->children;
// 指定された子要素をインデックス番号で返します
$e-> ;children(0);
// 最初のリソース要素を返します
$e->first_child ();
// 最後の子要素を返す
$e->last _child ();
// 前の隣接する要素を返す
$e->prev_sibling ();
// 次の隣接する要素を返すelement
$e->next_sibling ();
?>
要素の属性操作
属性セレクターを操作するには、単純な正規表現を使用します。
[attribute] - 特定の属性を含む HTML 要素を選択します [attribute=value] - 指定された値属性を持つすべての HTML 要素を選択します
[attribute!=value] - 指定されていない値属性を持つすべての HTML 要素を選択します
[attribute^ =value ] - 指定された値で始まる属性を持つすべての HTML 要素を選択します
[attribute$=value] 指定された値で終わる属性を持つすべての HTML 要素を選択します
[attribute*=value] - 指定された値を持つ属性を含むすべての HTML 要素を選択しますvalue
パーサーで呼び出されます 要素属性
DOM 内の要素属性もオブジェクトです:
// この例では、$a のアンカー リンク値を $link 変数に割り当てます
$link = $a->href;
?>
または:
$link = $html->find('a',0)->href;
?
各オブジェクトには 4 つの基本オブジェクトがあります。プロパティ:
tag – HTML タグ名を返します
innertext – innerHTML を返します
outertext – externalHTML を返します
plaintext – HTML タグ内のテキストを返します
パーサーで要素を編集します
要素属性の編集の使用法は、次の呼び出しと似ています:
//$a
$a->href = 'http://www. jb51.net';
//アンカーリンクを削除
$a->href = null;
//アンカーリンクが存在するか検出
if(isset($a->href)) {
//コード
}
?>
解析 コンテナ内の要素を追加または削除する特別な方法はありませんが、別の方法で使用できます。
// 要素を削除します
$e->outertext = '';
// 要素を追加します
$e->outertext = $e->outertext '
// 要素を挿入します
$ e->outertext = '
?
変更した HTML DOM ドキュメントの保存も非常に簡単です:
コードをコピーします。コードは次のとおりです:
パーサーが大量のメモリを消費しないようにする方法
この記事の冒頭で、著者は Simple HTML DOM パーサーが大量のメモリを消費する問題について言及しました。 PHP スクリプトがメモリを大量に消費すると、Web サイトが応答を停止し、一連の深刻な問題が発生します。解決策も非常に簡単です。パーサーが HTML ドキュメントをロードして使用した後、必ずこのオブジェクトをクリーンアップしてください。もちろん、問題をあまり深刻に考えないでください。 2 ~ 3 枚の原稿しかセットされていない場合は、クリーニングしてもしなくても大きな違いはありません。 5 つ、10 つ、またはそれ以上のドキュメントをロードする場合、使用後にメモリをクリアするのは絶対にあなたの責任です ^_^
コードをコピーします
コードは次のとおりです:
www.bkjia.com

PHPは、動的なWeb開発およびサーバー側のアプリケーションに使用されるサーバー側のスクリプト言語です。 1.PHPは、編集を必要とせず、迅速な発展に適した解釈言語です。 2。PHPコードはHTMLに組み込まれているため、Webページの開発が簡単になりました。 3。PHPプロセスサーバー側のロジック、HTML出力を生成し、ユーザーの相互作用とデータ処理をサポートします。 4。PHPは、データベースと対話し、プロセスフォームの送信、サーバー側のタスクを実行できます。

PHPは過去数十年にわたってネットワークを形成しており、Web開発において重要な役割を果たし続けます。 1)PHPは1994年に発信され、MySQLとのシームレスな統合により、開発者にとって最初の選択肢となっています。 2)コア関数には、動的なコンテンツの生成とデータベースとの統合が含まれ、ウェブサイトをリアルタイムで更新し、パーソナライズされた方法で表示できるようにします。 3)PHPの幅広いアプリケーションとエコシステムは、長期的な影響を促進していますが、バージョンの更新とセキュリティの課題にも直面しています。 4)PHP7のリリースなど、近年のパフォーマンスの改善により、現代の言語と競合できるようになりました。 5)将来的には、PHPはコンテナ化やマイクロサービスなどの新しい課題に対処する必要がありますが、その柔軟性とアクティブなコミュニティにより適応性があります。

PHPの中心的な利点には、学習の容易さ、強力なWeb開発サポート、豊富なライブラリとフレームワーク、高性能とスケーラビリティ、クロスプラットフォームの互換性、費用対効果が含まれます。 1)初心者に適した学習と使用が簡単。 2)Webサーバーとの適切な統合および複数のデータベースをサポートします。 3)Laravelなどの強力なフレームワークを持っています。 4)最適化を通じて高性能を達成できます。 5)複数のオペレーティングシステムをサポートします。 6)開発コストを削減するためのオープンソース。

PHPは死んでいません。 1)PHPコミュニティは、パフォーマンスとセキュリティの問題を積極的に解決し、PHP7.xはパフォーマンスを向上させます。 2)PHPは最新のWeb開発に適しており、大規模なWebサイトで広く使用されています。 3)PHPは学習しやすく、サーバーはうまく機能しますが、タイプシステムは静的言語ほど厳格ではありません。 4)PHPは、コンテンツ管理とeコマースの分野で依然として重要であり、エコシステムは進化し続けています。 5)OpcacheとAPCを介してパフォーマンスを最適化し、OOPと設計パターンを使用してコードの品質を向上させます。

PHPとPythonには独自の利点と短所があり、選択はプロジェクトの要件に依存します。 1)PHPは、Web開発に適しており、学習しやすく、豊富なコミュニティリソースですが、構文は十分に近代的ではなく、パフォーマンスとセキュリティに注意を払う必要があります。 2)Pythonは、簡潔な構文と学習が簡単なデータサイエンスと機械学習に適していますが、実行速度とメモリ管理にはボトルネックがあります。

PHPは動的なWebサイトを構築するために使用され、そのコア関数には次のものが含まれます。1。データベースに接続することにより、動的コンテンツを生成し、リアルタイムでWebページを生成します。 2。ユーザーのインタラクションを処理し、提出をフォームし、入力を確認し、操作に応答します。 3.セッションとユーザー認証を管理して、パーソナライズされたエクスペリエンスを提供します。 4.パフォーマンスを最適化し、ベストプラクティスに従って、ウェブサイトの効率とセキュリティを改善します。

PHPはMySQLIおよびPDO拡張機能を使用して、データベース操作とサーバー側のロジック処理で対話し、セッション管理などの関数を介してサーバー側のロジックを処理します。 1)MySQLIまたはPDOを使用してデータベースに接続し、SQLクエリを実行します。 2)セッション管理およびその他の機能を通じて、HTTPリクエストとユーザーステータスを処理します。 3)トランザクションを使用して、データベース操作の原子性を確保します。 4)SQLインジェクションを防ぎ、例外処理とデバッグの閉鎖接続を使用します。 5)インデックスとキャッシュを通じてパフォーマンスを最適化し、読みやすいコードを書き、エラー処理を実行します。

PHPで前処理ステートメントとPDOを使用すると、SQL注入攻撃を効果的に防ぐことができます。 1)PDOを使用してデータベースに接続し、エラーモードを設定します。 2)準備方法を使用して前処理ステートメントを作成し、プレースホルダーを使用してデータを渡し、メソッドを実行します。 3)結果のクエリを処理し、コードのセキュリティとパフォーマンスを確保します。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

SublimeText3 中国語版
中国語版、とても使いやすい

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。
