Python - クローラーがログインをシミュレートした後、csdn バックグラウンド記事リストをクロールする際に問題が発生しました

Question

クローラーは確かにログインしています。個人情報をクロールして取得できるためですが、次の図の URL は取得できません。URL は http://write.blog.csdn.net/postlist です。これはあなたのものです。 csdn バックステージ。コードを投稿しましょう。py2.7 の {code...}。上記のコードの出力は...

高洛峰 · Answer

このアドレスは 302 ジャンプを返すため、返されたヘッダーの場所に基づいてリクエストを続行し、返されたコンテンツを分析して処理を続行する必要があります。ブラウザは、これらの 302 ジャンプを実行し、返された js などを実行するのに役立ちます。コンテンツを手動でキャプチャするには、自分で処理する必要があります。

迷茫 · Answer

Cookieを使用するだけです

Python - クローラーがログインをシミュレートした後、csdn バックグラウンド記事リストをクロールする際に問題が発生しました

全員に返信(2)返信します