HTMLAgilityPack でのスクリプトの実行
Web スクレイピング シナリオでは、JavaScript を利用してコンテンツを設定するページがよく見られます。ただし、HTML Agility Pack を使用してこれらのページを取得すると、JavaScript スクリプトが実行されず、不完全なデータが残ります。
HTMLAgilityPack でスクリプトを強制的に実行できますか?
いいえ、HTML Agility Pack は厳密には HTML パーサーです。 JavaScript を解釈したり、JavaScript を内部ドキュメント表現にバインドしたりする機能はありません。スクリプトを実行するには、Web ブラウザが必要です。
代替アプローチ
最適なソリューションは、HTML パーサー、JavaScript インタプリタ、およびシミュレートされた DOM 環境。ただし、完全に .NET 環境内で動作するこのようなツールは現在利用できません。
実際の実装
この制限を回避するには、WebBrowser コントロールを利用して、プログラムによる制御の下、Internet Explorer にページをロードして実行します。この方法は速度や美しさの点で理想的ではありませんが、望ましい結果を達成できます。
以上がHTML Agility Pack は JavaScript スクリプトを実行できますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。