Heim >Backend-Entwicklung >Python-Tutorial >Python-Webcrawler – über einfache simulierte Anmeldung
Der heutige Artikel stellt hauptsächlich den Python-Webcrawler vor – die einfache simulierte Anmeldung, die einen gewissen Referenzwert hat. Jetzt können Freunde in Not auf
zugreifen und die Webseite abrufen Anders: Wenn Sie die Anmeldung simulieren möchten, müssen Sie einige Informationen an den Server senden, z. B. Kontonummer, Passwort usw.
Das Simulieren der Anmeldung auf einer Website ist grob in die folgenden Schritte unterteilt:
1. Finden Sie zunächst die versteckten Informationen der Anmeldewebsite und ihrer Inhalt Zuerst speichern (da die Website, auf der ich mich hier angemeldet habe, keine zusätzlichen Informationen enthält, gibt es hier keine Informationsfilterung und -speicherung)
2. Senden Sie die Informationen
3. Erhalten Sie die Informationen nach der Anmeldung
Geben Sie mir zuerst den Quellcode
<span style="font-size: 14px;"># -*- coding: utf-8 -*- import requests def login(): session = requests.session() # res = session.get('http://my.its.csu.edu.cn/').content login_data = { 'userName': '3903150327', 'passWord': '136510', 'enter': 'true' } session.post('http://my.its.csu.edu.cn//', data=login_data) res = session.get('http://my.its.csu.edu.cn/Home/Default') print(res.text) login()</span>
1. Filtern Sie, um versteckte Informationen zu erhalten
Geben Sie die Entwicklertools ein (drücken Sie F12), suchen Sie das Netzwerk, melden Sie sich manuell an, suchen Sie die erste Anfrage. Unten im Header wird ein Datensegment angezeigt. Dies ist nur das Informationen, die zum Anmelden erforderlich sind. Wenn Sie die versteckten Informationen ändern möchten
, rufen Sie zuerst den HTML-Inhalt der Webseite
res = session.get('http://my.its.csu.edu.cn/').content
ab und filtern Sie den Inhalt dann durch reguläre Ausdrücke
2. Senden Sie die Informationen
Suchen Sie im Quellcode nach der Aktion, die zum Senden des Formulars erforderlich ist , und die Methode
Verwenden Sie
session.post('http://my.its.csu.edu.cn/(这里就是提交的action)', data=login_data)
, um Informationen zu übermitteln
3 nach der Anmeldung
Nachdem die Informationen übermittelt wurden, ist die simulierte Anmeldung erfolgreich
Dann können Sie die angemeldeten Informationen erhalten
res = session.get('http://my.its.csu.edu.cn/Home/Default').content
Verwandte Empfehlungen:
Instanz eines Python-Crawlers, der die Proxy-IP erfasst und die Verfügbarkeit überprüft
Python-Crawler-Browseridentifizierung Bibliothek
Das obige ist der detaillierte Inhalt vonPython-Webcrawler – über einfache simulierte Anmeldung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!