ホームページ  >  記事  >  バックエンド開発  >  Python Web クローラー -- 簡単な模擬ログインについて

Python Web クローラー -- 簡単な模擬ログインについて

不言
不言オリジナル
2018-06-02 14:18:071619ブラウズ

今日の記事は主に Python Web クローラーについて紹介します。これは、特定の参考値がありますので、必要な友達に共有してください。Web ページで情報を取得するのとは異なります。シミュレートされたログインも必要です。アカウント番号、パスワードなどの情報をサーバーに送信する必要があります。

Web サイトへのログインのシミュレーションは、次の手順に大別されます。 1. まず、ログイン Web サイトの隠された情報を見つけて、その内容を保存します (ここでログインした Web サイトには追加情報がないため)ここには情報のフィルタリングと保存はありません)

2. 情報を送信します

3. ログイン後に情報を取得します

<span style="font-size: 14px;"># -*- coding: utf-8 -*-
import requests
def login():
 session = requests.session()
 # res = session.get(&#39;http://my.its.csu.edu.cn/&#39;).content
 login_data = {
 &#39;userName&#39;: &#39;3903150327&#39;,
 &#39;passWord&#39;: &#39;136510&#39;,
 &#39;enter&#39;: &#39;true&#39;
 }
 session.post(&#39;http://my.its.csu.edu.cn//&#39;, data=login_data)
 res = session.get(&#39;http://my.its.csu.edu.cn/Home/Default&#39;)
 print(res.text)
login()</span>

1.隠された情報を取得します

開発者ツールに入り (F12 を押します)、ネットワークを見つけて手動でログインし、最初のリクエストを見つけます。ヘッダーの下部にデータ セグメントがあります。ログイン。 。非表示の情報を変更したい場合は、まず Web ページの Html コンテンツを取得します

res = session.get(&#39;http://my.its.csu.edu.cn/&#39;).content

、次に正規表現でコンテンツをフィルタリングします

次に、情報を送信します

検索ソースコード フォーム送信に必要なアクションとメソッド

Use

session.post(&#39;http://my.its.csu.edu.cn/(这里就是提交的action)&#39;, data=login_data)

このメソッドは情報を送信します

3. ログイン後の情報を取得します

情報が送信された後、シミュレートされたログインに成功しました

接続 ログイン後に情報を取得できます

res = session.get(&#39;http://my.its.csu.edu.cn/Home/Default&#39;).content

関連する推奨事項:

プロキシ IP を取得して可用性を確認する Python クローラーのインスタンス

Python クローラー ブラウザー識別ライブラリ


以上がPython Web クローラー -- 簡単な模擬ログインについての詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。