Web クローリング中に HTML 要素を見つけることはできません。この要素はサイト検査ツールに表示されます

Question

この URL からすべてのテーブルのタイトルをクロールしようとしています: https://www.nature.com/articles/s41586-023-06192-4 Web サイトで次の HTML 要素を見つけることができます: Table1PracticalCt–M–Ctanglesこのタイトルをクロールできません

P粉920485285 · Answer

つまり、使用したコードは問題ないようですが、思い浮かぶ問題は、Web サイトが JavaScript または XHR 呼び出しを介してクロールしたい要素を読み込んでいる可能性があるため、リクエストライブラリを使用してリクエストを送信すると、その要素を取得できません。

この問題を解決する方法は、Selenium を使用し、Selenium で Web サイトを開き、ページのソースコードを bs4 にロードして、コードが正常に動作するようにすることです。

注: Web サイト全体がロードされたら、ページのソースコードを bs4 にロードします。この Web サイトのコンテンツを表示するにはログインが必要であるため、Selenium を使用してログイン関数を作成する必要もあります。

Web クローリング中に HTML 要素を見つけることはできません。この要素はサイト検査ツールに表示されます

全員に返信(1)返信します