這篇文章主要為大家詳細介紹了使用Python的Requests包模擬登陸,具有一定的參考價值,有興趣的小伙伴們可以參考一下
前段時間喜歡用python去抓一些頁面玩,但基本上都用get請求一些頁面,再透過正規去過濾。
今天試了一下,模擬登陸個人網站。發現也比較簡單。讀懂本文需要對http協定和http會話有一定的理解。
註明:因為模擬登陸的是我的個人網站,所以以下程式碼對個人網站和帳號密碼做了處理。
網站分析
爬蟲的必備第一步,分析目標網站。這裡使用谷歌瀏覽器的開發者工具分析。
透過登陸抓取,看到這樣一個請求。
上方部分為請求頭,下方部分為請求是傳送的參數。圖片可以看出,頁面透過表單提交了三個參數。分別為_csrf,usermane,password。
其中csrf是為了預防跨域腳本偽造。原理很簡單,就是每一次請求,伺服器產生一串加密字串。放在隱藏的input表單中。再一次請求的時候,把這個字串一起傳過去,為了驗證是否為同一個使用者的請求。
因此,我們的程式碼邏輯就有了。首先請求一次登入頁面。然後分析頁面,拿到csrf字串。最後把這個字串和帳號密碼一起傳給伺服器用來登入。
第一份程式碼
#!/usr/bin/env python2.7 # -*- coding: utf-8 -*- import requests import re # 头部信息 headers = { 'Host':"localhost", 'Accept-Language':"zh-CN,zh;q=0.8", 'Accept-Encoding':"gzip, deflate", 'Content-Type':"application/x-www-form-urlencoded", 'Connection':"keep-alive", 'Referer':"http://localhost/login", 'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36" } # 登陆方法 def login(url,csrf): data = { "_csrf" : csrf, "username": "xiedj", "password": "***" } response = requests.post(url, data=data, headers=headers) return response.content # 第一次访问获取csrf值 def get_login_web(url): page = requests.get('http://localhost/login') reg = r'<meta name="csrf-token" content="(.+)">' csrf = re.findall(reg,page.content)[0] login_page = login(url,csrf) print login_page if __name__ == "__main__": url = "http://localhost/login/checklogin" get_login_web(url)
#程式碼看起來好像沒有什麼問題。然而執行的時候出錯了。核查了一下,錯誤的原因是,csrf驗證失敗!
再確認一次取得的csrf和要求登入的csrf字串沒問題了之後,我想到了一個問題。
如果,大家還不知道錯誤原因的話,這裡可以暫停思考一個問題。 「伺服器如何知道,第一次請求獲取csrf和第二次post登入請求是同一個使用者?」
到這,應該都清楚了,如果要登入成功,需要解決如何讓服務相信兩次請求是同一個使用者。這裡要用到http會話(不清楚的可以自行百度,這裡簡單介紹)。
http協定是一個種無狀態的協定。為了使這種無狀態變得有狀態,因此引進了會話。簡單的講,透過session去記錄這個狀態。當一個使用者第一次要求web服務的時候,伺服器會產生一個session,用來保存這個使用者的資訊。同時,在回傳給用戶端時,把這個sessionID保存在cookies裡。當用戶再一次要求的時候,瀏覽器會把這個cookies帶上。因此在伺服器端就能知道多次請求是否為同一個使用者。
因此我們的程式碼,需要在第一次要求的時候拿到這個sessionID。第二次請求的時候把這個sessionID一起傳過去。而requests厲害的地方就是,一句簡單requests.Session(),就能使用這個會話物件。
第二份程式碼
#!/usr/bin/env python2.7 # -*- coding: utf-8 -*- import requests import re # 头部信息 headers = { 'Host':"localhost", 'Accept-Language':"zh-CN,zh;q=0.8", 'Accept-Encoding':"gzip, deflate", 'Content-Type':"application/x-www-form-urlencoded", 'Connection':"keep-alive", 'Referer':"http://localhost/login", 'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36" } # 登陆方法 def login(url,csrf,r_session): data = { "_csrf" : csrf, "username": "xiedj", "password": "***" } response = r_session.post(url, data=data, headers=headers) return response.content # 第一次访问获取csrf值 def get_login_web(url): r_session = requests.Session() page = r_session.get('http://localhost/login') reg = r'<meta name="csrf-token" content="(.+)">' csrf = re.findall(reg,page.content)[0] login_page = login(url,csrf,r_session) print login_page if __name__ == "__main__": url = "http://localhost/login/checklogin" get_login_web(url)
#成功取得登陸後的頁面
由程式碼可以知道,requests.Session()啟動會話物件後,第二次請求會自動把上一次的sessionID一起傳過去。
相關推薦:
分析使用python的open函數時報No Such File or DIr的錯誤原因
###############################################################################################
以上是如何使用Python的Requests套件實現模擬登陸的詳細內容。更多資訊請關注PHP中文網其他相關文章!

使用NumPy創建多維數組可以通過以下步驟實現:1)使用numpy.array()函數創建數組,例如np.array([[1,2,3],[4,5,6]])創建2D數組;2)使用np.zeros(),np.ones(),np.random.random()等函數創建特定值填充的數組;3)理解數組的shape和size屬性,確保子數組長度一致,避免錯誤;4)使用np.reshape()函數改變數組形狀;5)注意內存使用,確保代碼清晰高效。

播放innumpyisamethodtoperformoperationsonArraySofDifferentsHapesbyAutapityallate AligningThem.itSimplifififiesCode,增強可讀性,和Boostsperformance.Shere'shore'showitworks:1)較小的ArraySaraySaraysAraySaraySaraySaraySarePaddedDedWiteWithOnestOmatchDimentions.2)

forpythondataTastorage,choselistsforflexibilityWithMixedDatatypes,array.ArrayFormeMory-effficityHomogeneousnumericalData,andnumpyArraysForAdvancedNumericalComputing.listsareversareversareversareversArversatilebutlessEbutlesseftlesseftlesseftlessforefforefforefforefforefforefforefforefforefforlargenumerdataSets; arrayoffray.array.array.array.array.array.ersersamiddreddregro

Pythonlistsarebetterthanarraysformanagingdiversedatatypes.1)Listscanholdelementsofdifferenttypes,2)theyaredynamic,allowingeasyadditionsandremovals,3)theyofferintuitiveoperationslikeslicing,but4)theyarelessmemory-efficientandslowerforlargedatasets.

toAccesselementsInapyThonArray,useIndIndexing:my_array [2] accessEsthethEthErlement,returning.3.pythonosezero opitedEndexing.1)usepositiveandnegativeIndexing:my_list [0] fortefirstElment,fortefirstelement,my_list,my_list [-1] fornelast.2] forselast.2)

文章討論了由於語法歧義而導致的Python中元組理解的不可能。建議使用tuple()與發電機表達式使用tuple()有效地創建元組。 (159個字符)

本文解釋了Python中的模塊和包裝,它們的差異和用法。模塊是單個文件,而軟件包是帶有__init__.py文件的目錄,在層次上組織相關模塊。

文章討論了Python中的Docstrings,其用法和收益。主要問題:Docstrings對於代碼文檔和可訪問性的重要性。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3漢化版
中文版,非常好用

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具