HtmlAgilityPack を使用して Web ページをスクレイピングしようとすると、動的に取得する JavaScript が存在するため、取得したデータに不一致が発生する可能性があります。そしてページにデータを追加します。このため、目的のデータを取得するために実行する必要があるスクリプトをどのように処理すればよいでしょうか?
残念ながら、HtmlAgilityPack は単なる HTML パーサーであり、JavaScript を解釈したり、そのドキュメント表現にバインドしたりする機能がありません。この問題を解決するには、HTML パーサー、JavaScript インタプリタ、ブラウザ DOM シミュレータを備えた完全なヘッドレス Web ブラウザが必要です。ただし、現時点では、.NET 環境内で完全に動作するソリューションはありません。
実際的なアプローチには、WebBrowser コントロールを利用して、プログラム的に Internet Explorer にページを読み込んで実行することが含まれます。この方法は効率的でなく、見た目も美しくないかもしれませんが、スクリプトの実行が必要なデータを取得するという目的は達成できます。
以上がHtmlAgilityPack を使用して JavaScript を実行してデータをスクレイピングするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。