Heim  >  Artikel  >  Backend-Entwicklung  >  Python-Webcrawler – über einfache simulierte Anmeldung

Python-Webcrawler – über einfache simulierte Anmeldung

不言
不言Original
2018-06-02 14:18:071678Durchsuche

Der heutige Artikel stellt hauptsächlich den Python-Webcrawler vor – die einfache simulierte Anmeldung, die einen gewissen Referenzwert hat. Jetzt können Freunde in Not auf

zugreifen und die Webseite abrufen Anders: Wenn Sie die Anmeldung simulieren möchten, müssen Sie einige Informationen an den Server senden, z. B. Kontonummer, Passwort usw.

Das Simulieren der Anmeldung auf einer Website ist grob in die folgenden Schritte unterteilt:

1. Finden Sie zunächst die versteckten Informationen der Anmeldewebsite und ihrer Inhalt Zuerst speichern (da die Website, auf der ich mich hier angemeldet habe, keine zusätzlichen Informationen enthält, gibt es hier keine Informationsfilterung und -speicherung)

2. Senden Sie die Informationen

3. Erhalten Sie die Informationen nach der Anmeldung

Geben Sie mir zuerst den Quellcode

<span style="font-size: 14px;"># -*- coding: utf-8 -*-
import requests
def login():
 session = requests.session()
 # res = session.get(&#39;http://my.its.csu.edu.cn/&#39;).content
 login_data = {
 &#39;userName&#39;: &#39;3903150327&#39;,
 &#39;passWord&#39;: &#39;136510&#39;,
 &#39;enter&#39;: &#39;true&#39;
 }
 session.post(&#39;http://my.its.csu.edu.cn//&#39;, data=login_data)
 res = session.get(&#39;http://my.its.csu.edu.cn/Home/Default&#39;)
 print(res.text)
login()</span>

1. Filtern Sie, um versteckte Informationen zu erhalten

Geben Sie die Entwicklertools ein (drücken Sie F12), suchen Sie das Netzwerk, melden Sie sich manuell an, suchen Sie die erste Anfrage. Unten im Header wird ein Datensegment angezeigt. Dies ist nur das Informationen, die zum Anmelden erforderlich sind. Wenn Sie die versteckten Informationen ändern möchten

, rufen Sie zuerst den HTML-Inhalt der Webseite

res = session.get(&#39;http://my.its.csu.edu.cn/&#39;).content

ab und filtern Sie den Inhalt dann durch reguläre Ausdrücke

2. Senden Sie die Informationen

Suchen Sie im Quellcode nach der Aktion, die zum Senden des Formulars erforderlich ist , und die Methode

Verwenden Sie

session.post(&#39;http://my.its.csu.edu.cn/(这里就是提交的action)&#39;, data=login_data)

, um Informationen zu übermitteln

3 nach der Anmeldung

Nachdem die Informationen übermittelt wurden, ist die simulierte Anmeldung erfolgreich

Dann können Sie die angemeldeten Informationen erhalten

res = session.get(&#39;http://my.its.csu.edu.cn/Home/Default&#39;).content

Verwandte Empfehlungen:

Instanz eines Python-Crawlers, der die Proxy-IP erfasst und die Verfügbarkeit überprüft

Python-Crawler-Browseridentifizierung Bibliothek

Das obige ist der detaillierte Inhalt vonPython-Webcrawler – über einfache simulierte Anmeldung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Vorheriger Artikel:Modul string.py in PythonNächster Artikel:Modul string.py in Python