Python - スクレイピーを使用してクローラーを作成します。リクエストを送信すると、サーバーはすべて 202 を直接返します。どうすればよいですか?

Question

私がクロールしたのは中国判決文書ネットワークで、以前は正常に動作していました。リクエストを送信すると、サーバーは 200 を返し、その後本体内のデータを処理しました。しかし 1 週間前、突然すべてのリクエストが 202 を返しました。応答本文も空で、データをまったく取得できず、ブロックしてコールバック関数で待機しました...

欧阳克 · Answer

この状況は通常、違法なクロールによって引き起こされ、サーバーはクロール防止制限を実装しています。合法的にキャプチャされた場合は、コンテンツ部門に連絡して、偶発的な損害がないかどうかを確認できます。違法にキャプチャされた場合は、これを行わないことをお勧めします

。

过去多啦不再A梦 · Answer

収集が妨げられている場合は、IP アドレスを変更するか、収集を防ぐための抜け穴を探してみることができます

Python - スクレイピーを使用してクローラーを作成します。リクエストを送信すると、サーバーはすべて 202 を直接返します。どうすればよいですか?

全員に返信(2)返信します