Maison >développement back-end >Tutoriel Python >Robot d'exploration Web Python – à propos d'une simple connexion simulée

Robot d'exploration Web Python – à propos d'une simple connexion simulée

不言
不言original
2018-06-02 14:18:071709parcourir

L'article d'aujourd'hui présente principalement le robot d'exploration Web Python - une simple connexion simulée, qui a une certaine valeur de référence. Maintenant, je le partage avec tout le monde. Les amis dans le besoin peuvent se référer à

et obtenir la page Web. différent Si vous souhaitez simuler la connexion, vous devez envoyer certaines informations au serveur, telles que le numéro de compte, le mot de passe, etc.

La simulation de connexion à un site Web est grossièrement divisée en les étapes suivantes :

1. Trouvez d'abord les informations cachées du site Web de connexion et son contenu. contenu Enregistrez d'abord (puisque le site Web auquel je me suis connecté ici ne contient pas d'informations supplémentaires, il n'y a pas de filtrage et d'enregistrement des informations ici)

2. Soumettez les informations

3. Obtenez les informations après la connexion

Donnez-moi d'abord le code source

<span style="font-size: 14px;"># -*- coding: utf-8 -*-
import requests
def login():
 session = requests.session()
 # res = session.get(&#39;http://my.its.csu.edu.cn/&#39;).content
 login_data = {
 &#39;userName&#39;: &#39;3903150327&#39;,
 &#39;passWord&#39;: &#39;136510&#39;,
 &#39;enter&#39;: &#39;true&#39;
 }
 session.post(&#39;http://my.its.csu.edu.cn//&#39;, data=login_data)
 res = session.get(&#39;http://my.its.csu.edu.cn/Home/Default&#39;)
 print(res.text)
login()</span>

1. informations cachées

Entrez dans les outils de développement (appuyez sur F12), recherchez le réseau, connectez-vous manuellement et recherchez la première demande. Il y aura un segment de données au bas de l'en-tête. , ce sont les informations nécessaires pour vous connecter. Si vous souhaitez modifier les informations cachées

Obtenez d'abord le contenu HTML de la page Web

res = session.get(&#39;http://my.its.csu.edu.cn/&#39;).content

Puis filtrez le contenu via le filtre régulier expressions

2. Soumettez les informations

Trouvez l'action et la méthode requises pour soumettre le formulaire dans le code source

Utilisez

session.post(&#39;http://my.its.csu.edu.cn/(这里就是提交的action)&#39;, data=login_data)

pour soumettre des informations

3. Obtenez le informations de connexion Informations

Une fois les informations soumises, la connexion simulée est réussie

Ensuite, vous pouvez obtenir les informations de connexion

res = session.get(&#39;http://my.its.csu.edu.cn/Home/Default&#39;).content

Recommandations associées :

Instance du robot d'exploration Python récupérant l'adresse IP du proxy et vérifiant la disponibilité

Python Bibliothèque de logos du navigateur sur chenilles

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:Module string.py en PythonArticle suivant:Module string.py en Python