ホームページ >バックエンド開発 >Python チュートリアル >Python Web クローラー -- 簡単な模擬ログインについて
今日の記事は主に Python Web クローラーについて紹介します。これは、特定の参考値がありますので、必要な友達に共有してください。Web ページで情報を取得するのとは異なります。シミュレートされたログインも必要です。アカウント番号、パスワードなどの情報をサーバーに送信する必要があります。
Web サイトへのログインのシミュレーションは、次の手順に大別されます。 1. まず、ログイン Web サイトの隠された情報を見つけて、その内容を保存します (ここでログインした Web サイトには追加情報がないため)ここには情報のフィルタリングと保存はありません)
2. 情報を送信します
3. ログイン後に情報を取得します
<span style="font-size: 14px;"># -*- coding: utf-8 -*- import requests def login(): session = requests.session() # res = session.get('http://my.its.csu.edu.cn/').content login_data = { 'userName': '3903150327', 'passWord': '136510', 'enter': 'true' } session.post('http://my.its.csu.edu.cn//', data=login_data) res = session.get('http://my.its.csu.edu.cn/Home/Default') print(res.text) login()</span>1.隠された情報を取得します
開発者ツールに入り (F12 を押します)、ネットワークを見つけて手動でログインし、最初のリクエストを見つけます。ヘッダーの下部にデータ セグメントがあります。ログイン。 。非表示の情報を変更したい場合は、まず Web ページの Html コンテンツを取得します
res = session.get('http://my.its.csu.edu.cn/').content、次に正規表現でコンテンツをフィルタリングします
次に、情報を送信します
検索ソースコード フォーム送信に必要なアクションとメソッドUse
session.post('http://my.its.csu.edu.cn/(这里就是提交的action)', data=login_data)このメソッドは情報を送信します 3. ログイン後の情報を取得します 情報が送信された後、シミュレートされたログインに成功しました
接続 ログイン後に情報を取得できます
res = session.get('http://my.its.csu.edu.cn/Home/Default').content関連する推奨事項:
プロキシ IP を取得して可用性を確認する Python クローラーのインスタンス
Python クローラー ブラウザー識別ライブラリ以上がPython Web クローラー -- 簡単な模擬ログインについての詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。