JavaScript - Web ページをクロールする Nodejs の問題

Question

一般的なアイデアに従って、nodejs を使用して Web サイトのすべてのニュースをキャプチャする予定です。まず、ニュースの各ページの URL を取得し、次に各ニュースの URL を取得して、リクエストを使用して各 URL のコンテンツを取得します。ただし、以下の Web サイトのすべてのページ情報と各ニュース ポイントはこれだけです。

阿神 · Answer

1. 前の記事と次の記事からわかるように、関数は click にバインドされています:boardView(1);

2. boadrview を通じてページ内の対応する関数を見つけます。リーリー

…………

3. データが変数リストから取得されていることを確認し、リストを探します

4. 1739 行目を参照:

リーリー

5. コンストラクターは jsList() と呼ばれ、対応するコードはここにあります: http://www.samsungsem.com/js/...

6 ステップ 2 のコードを振り返ってください: list.artTitles-->これらのデータは、jsList の cmsInit メソッドを介して cmsInit に設定されます:

リーリー

...

のデータは、4番目のパラメータデータから取得されます

7. ステップ 4 で渡されたデータ (new data()) を見てください。それで、data 関数が定義されている場所を見つけます。

検索して見つけます:

8. 開いて見てください: http://www.samsungsem.com/glo...

とても奇妙に感じます。なぜですか?

右クリックしてソースコードを表示します:

view-source: http://www.samsungsem.com/glo...

データ関数がここで定義されており、表示されるデータもここにあることがわかります。ページ。

过去多啦不再A梦 · Answer

ご回答ありがとうございます、まず確認してみます...

よく分からないところもありますが、ゆっくり見ていきますのでよろしくお願いします。

JavaScript - Web ページをクロールする Nodejs の問題

全員に返信(2)返信します