検索

ホームページ  >  に質問  >  本文

JavaScript - Web ページをクロールする Nodejs の問題

nodejs を使用して、以下の Web サイト上のすべてのニュースをキャプチャする予定です。一般的なアイデアに従って、まずニュースの各ページの URL を取得し、次に各ニュースの URL を取得します。
request と を使用して各 URL のコンテンツを取得します。それです

しかし、次の Web サイトのすべてのページング情報と、クリックされた各ニュースの URL は変更されていないようです。それらはすべてバックグラウンドで js を通じて実装されているようです。
newwork を使用したリクエストは表示されません。 Chrome の F12 タブ、誰かマスターがそれを取得する方法を教えてくれますか?

http://www.xxxxxxxxx.com/glob...

阿神阿神2779日前671

全員に返信(2)返信します

  • 阿神

    阿神2017-05-16 13:45:09

    1. 前の記事と次の記事からわかるように、関数は click にバインドされています:boardView(1);

    2. boadrview を通じてページ内の対応する関数を見つけます。 リーリー

    …………

    3. データが変数リストから取得されていることを確認し、リストを探します

    4. 1739 行目を参照:

    リーリー

    5. コンストラクターは jsList() と呼ばれ、対応するコードはここにあります: http://www.samsungsem.com/js/...

    6 ステップ 2 のコードを振り返ってください: list.artTitles-->これらのデータは、jsList の cmsInit メソッドを介して cmsInit に設定されます:

    リーリー

    ...

    のデータは、4番目のパラメータデータから取得されます

    7. ステップ 4 で渡されたデータ (new data()) を見てください。それで、data 関数が定義されている場所を見つけます。

    検索して見つけます: <script src="/global/news/data.js.jsp"></script>

    8. 開いて見てください: http://www.samsungsem.com/glo...

    とても奇妙に感じます。なぜですか?


    右クリックしてソース コードを表示します:

    view-source: http://www.samsungsem.com/glo...

    データ関数がここで定義されており、表示されるデータもここにあることがわかります。ページ。

    返事
    0
  • 过去多啦不再A梦

    过去多啦不再A梦2017-05-16 13:45:09

    ご回答ありがとうございます、まず確認してみます...

    よく分からないところもありますが、ゆっくり見ていきますのでよろしくお願いします。

    返事
    0
  • キャンセル返事