


Comment obtenir le bon nombre de candidats et de téléspectateurs lorsque vous rampez la page de travail 58.com?
58.com Informations de recrutement rampant: résoudre le problème des données incohérentes des candidats et des téléspectateurs
Lorsque vous rampez sur la page de recrutement 58.com, vous rencontrez souvent un problème difficile: le nombre de candidats et le nombre de téléspectateurs affichés par le code source de la page Web ne correspondent pas aux données affichées réellement sur la page, et le code source est souvent affiché comme 0, tandis que les données mises à jour en temps réel sur la page sont cohérentes avec le contenu des éléments dans l'outil de développeur de solider (F12). Cet article explorera comment résoudre ce problème et obtenir des candidats et des téléspectateurs précis.
Analyse des problèmes:
Afin d'éviter que les données soient rampantes avec malveillance, 58.com a adopté la méthode de chargement dynamiquement des données. Le nombre de candidats et de téléspectateurs sur la page n'est pas directement obtenu à partir du code source HTML, mais est chargé de manière asynchrone via JavaScript. Par conséquent, l'analyse directe du code source HTML ne peut pas obtenir les données correctes.
Solution:
Pour obtenir le nombre correct de candidats et de téléspectateurs, vous devez trouver l'interface API fournie par 58.com. En analysant les demandes de réseau, nous pouvons trouver une interface API pour obtenir des statistiques d'information de recrutement, avec une URL similaire au format suivant:
<code>https://statisticszp.58.com/position/totalcount/?infoId=27988...</code>
Le paramètre infoId
représente l'ID de position spécifique et doit être extrait en fonction de l'URL de la page de recrutement cible.
L'API renvoie l'exemple de données:
Les données JSON renvoyées par l'interface API contient les informations dont nous avons besoin:
{ "DeliveryCount": 1141, // Nombre de candidats "commentcount": 0, "InfoCount": 4, // Nombre de téléspectateurs "RessumeReadPercent": 0, "références": "", "nexurl": "null" }
Le champ deliveryCount
indique le nombre de candidats et le champ infoCount
indique le nombre de téléspectateurs.
Étapes de mise en œuvre:
Obtenez l'ID de travail (Infoid): analysez l'URL de la page de recrutement cible et recherchez la valeur des paramètres correspondant à l'ID du travail. Cela peut nécessiter l'utilisation d'expressions régulières ou d'autres méthodes de traitement des chaînes.
Construire URL de la demande de l'API: Remplacez l'
infoId
extrait dans le modèle d'URL de l'API pour former une URL complète de la demande d'API.Envoyez des demandes d'API: utilisez la bibliothèque
requests
de Python ou d'autres clients HTTP pour envoyer des demandes de GET à l'URL de l'API.Analyser les données JSON: analyser les données JSON renvoyées par l'API dans un dictionnaire Python, extraire les valeurs de
deliveryCount
etinfoCount
, c'est-à-dire le nombre correct de candidats et le nombre de téléspectateurs.
Grâce aux étapes ci-dessus, vous pouvez contourner le mécanisme de chargement dynamique de la page Web de 58.com et obtenir avec précision le nombre de candidats et de téléspectateurs sur la page de recrutement. Veuillez noter que les noms d'adresse et de paramètres de l'interface API peuvent changer et doivent être ajustés en fonction des conditions réelles. Dans le même temps, veuillez respecter les règles Robots.txt de 58.com pour éviter une pression excessive sur le serveur.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

HTML, CSS et JavaScript sont les technologies de base pour la création de pages Web modernes: 1. HTML définit la structure de la page Web, 2. CSS est responsable de l'apparence de la page Web, 3. JavaScript fournit une dynamique de page Web et une interactivité, et ils travaillent ensemble pour créer un site Web avec une bonne expérience d'utilisation.

La fonction de HTML est de définir la structure et le contenu d'une page Web, et son objectif est de fournir un moyen standardisé d'afficher des informations. 1) HTML organise différentes parties de la page Web via des balises et des attributs, tels que des titres et des paragraphes. 2) Il soutient la séparation du contenu et des performances et améliore l'efficacité de maintenance. 3) Le HTML est extensible, permettant aux balises personnalisées d'améliorer le référencement.

Les tendances futures de HTML sont la sémantique et les composants Web, les tendances futures de CSS sont CSS-in-JS et CSShoudini, et les tendances futures de JavaScript sont WebAssembly et sans serveur. 1. La sémantique HTML améliore l'accessibilité et les effets de référencement, et les composants Web améliorent l'efficacité du développement, mais l'attention doit être accordée à la compatibilité du navigateur. 2. CSS-in-JS améliore la flexibilité de gestion du style mais peut augmenter la taille du fichier. CSShoudini permet le fonctionnement direct du rendu CSS. 3.WeBassembly optimise les performances de l'application du navigateur mais a une courbe d'apprentissage abrupte, et sans serveur simplifie le développement mais nécessite une optimisation des problèmes de démarrage à froid.

Les rôles de HTML, CSS et JavaScript dans le développement Web sont: 1. HTML définit la structure de la page Web, 2. CSS contrôle le style de page Web, et 3. JavaScript ajoute un comportement dynamique. Ensemble, ils construisent le cadre, l'esthétique et l'interactivité des sites Web modernes.

L'avenir de HTML est plein de possibilités infinies. 1) Les nouvelles fonctionnalités et normes comprendront plus de balises sémantiques et la popularité des composants Web. 2) La tendance de la conception Web continuera de se développer vers une conception réactive et accessible. 3) L'optimisation des performances améliorera l'expérience utilisateur grâce à des technologies de chargement d'image réactives et de chargement paresseux.

Les rôles de HTML, CSS et JavaScript dans le développement Web sont: HTML est responsable de la structure du contenu, CSS est responsable du style et JavaScript est responsable du comportement dynamique. 1. HTML définit la structure et le contenu de la page Web via des balises pour assurer la sémantique. 2. CSS contrôle le style de page Web via des sélecteurs et des attributs pour le rendre beau et facile à lire. 3. JavaScript contrôle le comportement de la page Web via les scripts pour atteindre des fonctions dynamiques et interactives.

HtmlisnotaprogrammingNanguage; itisamarkupLanguage.1) htmlstructuresAndFormaSwebContentUsingTags.2) itworkswithcssforStylingandjavaScriptForIterActivity, EnhancingWebDevelopment.

HTML est la pierre angulaire de la construction de la structure des pages Web. 1. HTML définit la structure et la sémantique du contenu et les utilisations, etc. Tags. 2. Fournir des marqueurs sémantiques, tels que, etc., pour améliorer l'effet SEO. 3. Pour réaliser l'interaction de l'utilisateur via des balises, faites attention à la vérification de la forme. 4. Utilisez des éléments avancés tels que, combinés avec JavaScript pour obtenir des effets dynamiques. 5. Les erreurs courantes incluent des étiquettes non clôturées et des valeurs d'attribut non déposées et des outils de vérification sont nécessaires. 6. Les stratégies d'optimisation comprennent la réduction des demandes HTTP, la compression du HTML, l'utilisation de balises sémantiques, etc.


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Navigateur d'examen sécurisé
Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

Adaptateur de serveur SAP NetWeaver pour Eclipse
Intégrez Eclipse au serveur d'applications SAP NetWeaver.

SublimeText3 Linux nouvelle version
Dernière version de SublimeText3 Linux