首頁  >  文章  >  後端開發  >  Python 網路爬蟲--關於簡單的模擬登錄

Python 網路爬蟲--關於簡單的模擬登錄

不言
不言原創
2018-06-02 14:18:071627瀏覽

今天這篇文章主要介紹了關於Python 網路爬蟲--關於簡單的模擬登錄,有著一定的參考價值,現在分享給大家,有需要的朋友可以參考一下

#和獲取網頁上的訊息不同,想要進行模擬登入還需要向伺服器發送一些訊息,如帳號、密碼等等。

模擬登入網站大致分為這麼幾步:

#1.先將登入網站的隱藏資訊找到,並將其內容先進行保存(由於我這裡登錄的網站並沒有額外信息,所以這裡沒有進行信息篩選保存)

2.將信息進行提交

#3.獲取登錄後的信息

先給上原始碼

<span style="font-size: 14px;"># -*- coding: utf-8 -*-
import requests
def login():
 session = requests.session()
 # res = session.get(&#39;http://my.its.csu.edu.cn/&#39;).content
 login_data = {
 &#39;userName&#39;: &#39;3903150327&#39;,
 &#39;passWord&#39;: &#39;136510&#39;,
 &#39;enter&#39;: &#39;true&#39;
 }
 session.post(&#39;http://my.its.csu.edu.cn//&#39;, data=login_data)
 res = session.get(&#39;http://my.its.csu.edu.cn/Home/Default&#39;)
 print(res.text)
login()</span>

#一、篩選得到隱藏訊息

進入開發者工具(按F12),找到其中的Network後,手動的先進行一次登錄,找到其中的第一個請求,在Header的底部會有一個data的資料段,這個就是登入所需的資訊。如果想要修改其中的隱藏訊息

先取得網頁Html的內容

res = session.get(&#39;http://my.its.csu.edu.cn/&#39;).content

再透過正規表示式篩選內容

二、將資訊進行提交

#找到原始碼中提交表單所需的action,和method

使用

session.post(&#39;http://my.its.csu.edu.cn/(这里就是提交的action)&#39;, data=login_data)

該方法提交資訊

三、取得登入後的資訊

資訊提交後模擬登入就成功了

接下來就可以取得登入後的資訊了

res = session.get(&#39;http://my.its.csu.edu.cn/Home/Default&#39;).content

相關推薦:

Python爬蟲抓取代理IP並檢驗可用性的實例

Python爬蟲瀏覽器標識庫

以上是Python 網路爬蟲--關於簡單的模擬登錄的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn