特定のページの JavaScript で生成されたコンテンツを抽出する

Question

次の部分コンテナの内容を抽出したいと考えています:

P粉041758700 · Answer

おっしゃるとおり、サイトではクライアント側 JavaScript が使用されており、上記のデータに対して追加の XHR リクエストは使用されていません。したがって、データは最初にロードされたコード (HTML JS) 内にあると予想される場合があります。コード内で event=643 のようなもの (event=479 と同様) を検索すると、提案が確認され、必要な JSON 形式の部分文字列が生成されます (I インデントが追加されました):

リーリー

抽出されたデータには必要なデータが含まれていることがわかります。これをスクレイピングするためにさまざまなツールを使用する場合があります。

特定のページの JavaScript で生成されたコンテンツを抽出する

全員に返信(1)返信します