この記事では、主に Python の Requests パッケージを使ってログインをシミュレートする方法を詳しく紹介します。興味のある方は参考にしてください。少し前に、私は Python を使っていくつかのページを取得するのが好きでしたが、基本的に、それらはすべて get を使用していくつかのページをリクエストし、通常のルールに従ってそれらをフィルタリングします。
今日試して、個人ウェブサイトへのログインをシミュレートしました。発見も比較的簡単です。この記事を読むには、http プロトコルと http セッションについてある程度の理解が必要です。
注: シミュレートされたログインは私の個人 Web サイトであるため、次のコードは個人 Web サイトとアカウントのパスワードを処理します。
ウェブサイト分析クローラーにとって重要な最初のステップは、ターゲットのウェブサイトを分析することです。ここでは、分析に Google Chrome の開発者ツールを使用します。
ログインをクロールすると、そのようなリクエストが見つかりました。
上の部分はリクエストヘッダー、下の部分はリクエストによって渡されるパラメータです。図からわかるように、ページはフォームを通じて 3 つのパラメーターを送信します。それぞれ _csrf、usermane、password です。
csrf は、クロスドメインのスクリプト偽造を防ぐためのものです。原理は非常に単純です。つまり、リクエストごとにサーバーが暗号化された文字列を生成します。非表示の入力フォームに配置します。別のリクエストを行う場合は、この文字列を一緒に渡して、同じユーザーからのリクエストであるかどうかを確認します。
それで、私たちのコードロジックはそこにあります。まず、ログイン ページをリクエストします。次に、ページを分析して csrf 文字列を取得します。最後に、この文字列とアカウントのパスワードがログインのためにサーバーに渡されます。
#!/usr/bin/env python2.7 # -*- coding: utf-8 -*- import requests import re # 头部信息 headers = { 'Host':"localhost", 'Accept-Language':"zh-CN,zh;q=0.8", 'Accept-Encoding':"gzip, deflate", 'Content-Type':"application/x-www-form-urlencoded", 'Connection':"keep-alive", 'Referer':"http://localhost/login", 'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36" } # 登陆方法 def login(url,csrf): data = { "_csrf" : csrf, "username": "xiedj", "password": "***" } response = requests.post(url, data=data, headers=headers) return response.content # 第一次访问获取csrf值 def get_login_web(url): page = requests.get('http://localhost/login') reg = r'<meta name="csrf-token" content="(.+)">' csrf = re.findall(reg,page.content)[0] login_page = login(url,csrf) print login_page if __name__ == "__main__": url = "http://localhost/login/checklogin" get_login_web(url)
コードには問題ないようです。しかし、実行中にエラーが発生しました。確認すると、エラーの原因は csrf 検証に失敗したためです。
取得したcsrfとログインに要求したcsrf文字列がOKであることを何度も確認した後、問題を思いつきました。
エラーの原因がまだわからない場合は、ここで一時停止して問題について考えることができます。 「サーバーは、csrf を取得するための最初のリクエストと、ログイン後の 2 番目のリクエストが同じユーザーからのものであることをどのようにして知るのでしょうか?」
この時点で、正常にログインしたい場合は、その方法を解決する必要があることが明らかです。 2 つのリクエストが同じユーザーからのものであるとサービスに認識させるためです。ここでは http セッションを使用する必要があります (よくわからない場合は、Baidu を自分で使用できます。ここで簡単に説明します)。
http プロトコルはステートレス プロトコルです。これをステートレスにするために、セッションが導入されました。簡単に言うと、セッションを通じてこのステータスを記録します。ユーザーが初めて Web サービスをリクエストすると、サーバーはユーザーの情報を保存するためのセッションを生成します。同時に、ユーザーに戻るときに、セッション ID が Cookie に保存されます。ユーザーが再度リクエストすると、ブラウザはこの Cookie を一緒に持ち込んでくれます。したがって、サーバーは複数のリクエストが同じユーザーに対するものであるかどうかを知ることができます。
したがって、最初のリクエストを行うときに、コードはこのセッション ID を取得する必要があります。このセッション ID を 2 番目のリクエストと一緒に渡します。リクエストの優れた点は、このセッション オブジェクトを単純な request.Session() で使用できることです。
2 番目のコード#!/usr/bin/env python2.7 # -*- coding: utf-8 -*- import requests import re # 头部信息 headers = { 'Host':"localhost", 'Accept-Language':"zh-CN,zh;q=0.8", 'Accept-Encoding':"gzip, deflate", 'Content-Type':"application/x-www-form-urlencoded", 'Connection':"keep-alive", 'Referer':"http://localhost/login", 'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36" } # 登陆方法 def login(url,csrf,r_session): data = { "_csrf" : csrf, "username": "xiedj", "password": "***" } response = r_session.post(url, data=data, headers=headers) return response.content # 第一次访问获取csrf值 def get_login_web(url): r_session = requests.Session() page = r_session.get('http://localhost/login') reg = r'<meta name="csrf-token" content="(.+)">' csrf = re.findall(reg,page.content)[0] login_page = login(url,csrf,r_session) print login_page if __name__ == "__main__": url = "http://localhost/login/checklogin" get_login_web(url)
ログイン後にページを正常に取得します
このコードから、requests.Session() がセッション オブジェクトを開始した後、2 番目のリクエストによってセッション オブジェクトが自動的に変更されることがわかります。前のもの セッションIDを一緒に渡します。関連する推奨事項:Pythonを使用してExcelチャートをエクスポートし、Picturesとしてエクスポートする方法Pythonのオープン関数を使用する場合のそのようなファイルやディールエラーの原因を解析する方法
以上がPython の Requests パッケージを使用してシミュレートされたログインを実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Pythonリストスライスの基本的な構文はリストです[start:stop:step]。 1.STARTは最初の要素インデックス、2。ストップは除外された最初の要素インデックスであり、3.ステップは要素間のステップサイズを決定します。スライスは、データを抽出するためだけでなく、リストを変更および反転させるためにも使用されます。

ListSoutPerformArraysIn:1)ダイナミシジョンアンドフレーケンティオン/削除、2)ストーリングヘテロゼンダタ、および3)メモリ効率の装飾、ButmayhaveslightPerformancostsinceNASOPERATIONS。

toconvertapythonarraytoalist、usetheList()constructororageneratorexpression.1)importhearraymoduleandcreateanarray.2)useList(arr)または[xforxinarr] toconvertoalistは、largedatatessを変えることを伴うものです。

choosearraysoverlistsinperbetterperformance andmemoryeficiencyspecificscenarios.1)largeNumericaldatasets:Araysreducememoryusage.2)パフォーマンス - クリティカル操作:ArraysOfferSpeedBoostsfortsfortsclikeappendedoring.3)タイプリー:Arrayesenforc

Pythonでは、ループに使用し、列挙し、包括的なリストを通過することができます。 Javaでは、従来のループを使用し、ループを強化してアレイを通過することができます。 1。Pythonリストトラバーサル方法は、ループ、列挙、およびリスト理解のためのものです。 2。Javaアレイトラバーサル法には、従来のループとループ用の強化が含まれます。

この記事では、バージョン3.10で導入されたPythonの新しい「マッチ」ステートメントについて説明します。これは、他の言語のスイッチステートメントに相当するものです。コードの読みやすさを向上させ、従来のif-elif-elよりもパフォーマンスの利点を提供します

Python 3.11の例外グループは、複数の例外を同時に処理することで、同時シナリオと複雑な操作でエラー管理を改善します。

Pythonの関数注釈は、タイプチェック、ドキュメント、およびIDEサポートの関数にメタデータを追加します。それらはコードの読みやすさ、メンテナンスを強化し、API開発、データサイエンス、ライブラリの作成において重要です。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

ホットトピック









