ホームページ  >  記事  >  バックエンド開発  >  クライアントIPを使用して分散クローラを実装する方法

クライアントIPを使用して分散クローラを実装する方法

WBOY
WBOYオリジナル
2016-08-08 09:06:431276ブラウズ

サーバー側のクローラーを使用する場合、Web ページを開くときに訪問者の IP を使用してクロールされた Web サイトにアクセスし、データをアップロードするにはどうすればよいでしょうか? Ajax はクロールされたデータを取得して、それを独自のサーバーに送信しますか?

同様の例やオープンソース プロジェクトはありますか?

返信内容:

サーバー側のクローラーを使用する場合、Web ページを開くときに訪問者の IP を使用してクロールされた Web サイトにアクセスし、データをアップロードするにはどうすればよいでしょうか? Ajax はクロールされたデータを取得して、それを独自のサーバーに送信しますか?

同様の例やオープンソース プロジェクトはありますか?

ユーザーのプライバシーを盗んでいるので、うまくいきません~

基本原則は、非表示の iframe を作成し、リクエストが成功した後、ajax を使用してローカル サーバーに保存することです。 。多くの Web サイトではクロール対策戦略が実装されているため、サーバー側のクローラーが失敗することがよくあります。この場合、クライアント側のクローラーを使用すると非常に便利です。

ただし、ユーザーエクスペリエンスはあまり良くありません。 。 。 。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。