python - Utilisez urllib pour récupérer le lien de téléchargement sur la page Web. Le fichier cible est au format xls, mais j'ai trouvé que le xls capturé est une table vide contenant un seul message d'erreur.

Question

Je souhaite utiliser urllib pour récupérer le lien de téléchargement xls de la liste boursière de la Bourse de Shanghai, comme indiqué dans la petite case rouge ci-dessous : J'ai découvert que le xls capturé ne signalait qu'un message d'erreur : Comment puis-je capturer le xls avec du contenu ? Le code est le suivant {code...}

黄舟 · Answer

Vous pouvez voir les informations renvoyées sur l'entreprise sur l'URL marquée d'une ligne rouge. Le reste sert à simuler le navigateur demandant cette URL. La référence dans l'en-tête de la requête ne doit pas être omise, sinon 403 sera signalé

.

N'oubliez pas de simuler la valeur de référence.

http://blog.csdn.net/ssshen14...
Il s'agit d'une solution existante

曾经蜡笔没有小新 · Answer

Afficher les cookies, référent

python - Utilisez urllib pour récupérer le lien de téléchargement sur la page Web. Le fichier cible est au format xls, mais j'ai trouvé que le xls capturé est une table vide contenant un seul message d'erreur.

répondre à tous(2)je répondrai