suchen
HeimWeb-FrontendHTML-TutorialWie bekomme ich die richtige Anzahl von Bewerbern und Zuschauern, wenn Sie auf der Arbeitsplatzseite 58.com kriechen?

Wie bekomme ich die richtige Anzahl von Bewerbern und Zuschauern, wenn Sie auf der Arbeitsplatzseite 58.com kriechen?

58.com Rekrutierungsinformationen Crawling: Lösen Sie das Problem inkonsistenter Daten von Bewerbern und Zuschauern

Wenn Sie auf der Rekrutierungsseite 58.com Crawling auf ein schwieriges Problem stoßen: Die Anzahl der Bewerber und die Anzahl der vom Webseiten angezeigten Zuschauer stimmen nicht mit den auf der Seite angezeigten Daten überein, und der Quellcode wird häufig als 0 angewendet, während die Daten in Echtzeit auf der Seite mit dem Element -Inhalt des Browser -Entwicklungs -Tools (F12) übereinstimmen. In diesem Artikel wird untersucht, wie dieses Problem gelöst und genaue Bewerber und Zuschauer erhalten werden.

Problemanalyse:

Um zu verhindern, dass Daten böswillig gekrabbelt werden, übernahm 58.com die Methode zum dynamischen Laden von Daten. Die Anzahl der Bewerber und Zuschauer auf der Seite wird nicht direkt aus dem HTML -Quellcode erhalten, sondern asynchron über JavaScript geladen. Daher kann der direkte Parsen -HTML -Quellcode nicht die richtigen Daten abrufen.

Lösung:

Um die korrekte Anzahl von Bewerbern und Zuschauern zu erhalten, müssen Sie die von 58.com bereitgestellte API -Schnittstelle finden. Durch die Analyse von Netzwerkanfragen können wir eine API -Schnittstelle zum Erhalten von Rekrutierungsinformationsstatistiken finden, wobei eine URL dem folgenden Format ähnelt:

 <code>https://statisticszp.58.com/position/totalcount/?infoId=27988...</code>

Der infoId -Parameter repräsentiert die spezifische Positions -ID und muss basierend auf der URL der Zielrekrutierungsseite extrahiert werden.

API gibt Datenbeispiel zurück:

Die von der API -Schnittstelle zurückgegebenen JSON -Daten enthält die Informationen, die wir benötigen:

 {
  "DeliveryCount": 1141, // Anzahl der Bewerber "Kommentar": 0,,
  "Infocount": 4, // Anzahl der Zuschauer "Lebensleitungen": 0,,
  "Referenurl": "",
  "Nexturl": "null"
}

Das Feld deliveryCount gibt die Anzahl der Bewerber an, und das infoCount -Feld zeigt die Anzahl der Zuschauer an.

Implementierungsschritte:

  1. Get Job ID (Infoid): Analysieren Sie die URL der Zielrekrutierungsseite und finden Sie den Parameterwert, der der Job -ID entspricht. Dies kann die Verwendung regelmäßiger Ausdrücke oder anderer String -Verarbeitungsmethoden erfordern.

  2. Konstrukte API -Anforderungs -URL: Ersetzen Sie die extrahierte infoId in die URL -URL -Vorlage für API, um eine vollständige API -Anforderungs -URL zu bilden.

  3. Senden Sie API -Anfragen: Verwenden Sie requests von Python oder andere HTTP -Clients, um GET -Anfragen an die API -URL zu senden.

  4. Analysieren Sie JSON -Daten: Analysieren Sie die von der API zurückgegebenen JSON -Daten in ein Python -Wörterbuch, extrahieren Sie die Werte von deliveryCount und infoCount , dh die korrekte Anzahl von Bewerbern und die Anzahl der Zuschauer.

In den oben genannten Schritten können Sie den dynamischen Lademechanismus der Webseite von 58.com umgehen und die Anzahl der Bewerber und Zuschauer auf der Rekrutierungsseite genau erhalten. Bitte beachten Sie, dass sich die Adresse und die Parameternamen der API -Schnittstelle ändern können und gemäß den tatsächlichen Bedingungen angepasst werden müssen. Gleichzeitig halten Sie sich bitte an die Regeln von Robots.txt von 58.com, um einen übermäßigen Druck auf den Server zu vermeiden.

Das obige ist der detaillierte Inhalt vonWie bekomme ich die richtige Anzahl von Bewerbern und Zuschauern, wenn Sie auf der Arbeitsplatzseite 58.com kriechen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
HTML vs. CSS und JavaScript: Vergleich von WebtechnologienHTML vs. CSS und JavaScript: Vergleich von WebtechnologienApr 23, 2025 am 12:05 AM

HTML, CSS und JavaScript sind die Kerntechnologien zum Erstellen moderner Webseiten: 1. HTML Definiert die Webseitenstruktur, 2. CSS ist für das Erscheinen der Webseite verantwortlich.

HTML als Markup -Sprache: seine Funktion und ihren ZweckHTML als Markup -Sprache: seine Funktion und ihren ZweckApr 22, 2025 am 12:02 AM

Die Funktion von HTML besteht darin, die Struktur und den Inhalt einer Webseite zu definieren, und der Zweck besteht darin, eine standardisierte Möglichkeit zur Anzeige von Informationen bereitzustellen. 1) HTML organisiert verschiedene Teile der Webseite über Tags und Attribute wie Titel und Absätze. 2) Es unterstützt die Trennung von Inhalten und Leistung und verbessert die Wartungseffizienz. 3) HTML ist erweiterbar, sodass benutzerdefinierte Tags SEO verbessern können.

Die Zukunft von HTML, CSS und JavaScript: WebentwicklungstrendsDie Zukunft von HTML, CSS und JavaScript: WebentwicklungstrendsApr 19, 2025 am 12:02 AM

Die zukünftigen Trends von HTML sind Semantik und Webkomponenten, die zukünftigen Trends von CSS sind CSS-in-JS und CssShudini, und die zukünftigen Trends von JavaScript sind WebAssembly und serverlos. 1. HTML -Semantik verbessern die Zugänglichkeits- und SEO -Effekte sowie Webkomponenten die Entwicklungseffizienz, aber der Browserkompatibilität sollte die Aufmerksamkeit geschenkt werden. 2. CSS-in-JS verbessert die Flexibilität des Stilmanagements, kann jedoch die Dateigröße erhöhen. CssShudini ermöglicht den direkten Betrieb des CSS -Renderings. 3.Webassembly optimiert die Browser -Anwendungsleistung, verfügt jedoch über eine steile Lernkurve, und serverloses vereinfacht die Entwicklung, erfordert jedoch eine Optimierung von Kaltstartproblemen.

HTML: Die Struktur, CSS: Der Stil, JavaScript: Das VerhaltenHTML: Die Struktur, CSS: Der Stil, JavaScript: Das VerhaltenApr 18, 2025 am 12:09 AM

Die Rollen von HTML, CSS und JavaScript in der Webentwicklung sind: 1. HTML definiert die Webseitenstruktur, 2. CSS steuert den Webseitenstil, und 3. JavaScript fügt ein dynamisches Verhalten hinzu. Zusammen bauen sie den Rahmen, die Ästhetik und die Interaktivität moderner Websites auf.

Die Zukunft von HTML: Evolution und Trends im WebdesignDie Zukunft von HTML: Evolution und Trends im WebdesignApr 17, 2025 am 12:12 AM

Die Zukunft von HTML ist voller unendlicher Möglichkeiten. 1) Neue Funktionen und Standards umfassen mehr semantische Tags und die Beliebtheit von Webcomponenten. 2) Der Webdesign -Trend entwickelt sich weiterhin für reaktionsschnelles und zugängliches Design. 3) Die Leistungsoptimierung verbessert die Benutzererfahrung durch reaktionsschnelle Bildlade- und faulen Ladetechnologien.

HTML vs. CSS vs. JavaScript: Ein vergleichender ÜberblickHTML vs. CSS vs. JavaScript: Ein vergleichender ÜberblickApr 16, 2025 am 12:04 AM

Die Rollen von HTML, CSS und JavaScript in der Webentwicklung sind: HTML ist für die Inhaltsstruktur verantwortlich, CSS ist für den Stil verantwortlich und JavaScript ist für dynamisches Verhalten verantwortlich. 1. HTML definiert die Webseitenstruktur und den Inhalt durch Tags, um die Semantik zu gewährleisten. 2. CSS steuert den Webseitenstil über Selektoren und Attribute, um es schön und einfach zu lesen. 3. JavaScript steuert das Verhalten von Webseiten über Skripte, um dynamische und interaktive Funktionen zu erzielen.

HTML: Ist es eine Programmiersprache oder etwas anderes?HTML: Ist es eine Programmiersprache oder etwas anderes?Apr 15, 2025 am 12:13 AM

HtmlisnotaprogrammingLanguage; itiSamarkuplanguage.1) htmlstructuresandFormatswebcontentuses.2) itWorkswithCSSForstylingandjavaScriptForinteraktivität, EnhancingWebDevelopment.

HTML: Erstellen der Struktur von WebseitenHTML: Erstellen der Struktur von WebseitenApr 14, 2025 am 12:14 AM

HTML ist der Eckpfeiler der Erstellung von Webseitenstruktur. 1. HTML definiert die Inhaltsstruktur und die Semantik und Verwendung usw. Tags. 2. Stellen Sie semantische Marker wie usw. zur Verfügung, um den SEO -Effekt zu verbessern. 3. Um die Benutzerinteraktion durch Tags zu verwirklichen, achten Sie auf die Verifizierung der Form. 4. Verwenden Sie fortschrittliche Elemente wie in Kombination mit JavaScript, um dynamische Effekte zu erzielen. 5. Zu den häufigen Fehlern gehören nicht abgegebene Bezeichnungen und nicht geeignete Attributwerte, und Überprüfungstools sind erforderlich. 6. Optimierungsstrategien umfassen das Reduzieren von HTTP -Anforderungen, die Komprimierung von HTML, die Verwendung semantischer Tags usw.

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

MinGW – Minimalistisches GNU für Windows

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

VSCode Windows 64-Bit-Download

VSCode Windows 64-Bit-Download

Ein kostenloser und leistungsstarker IDE-Editor von Microsoft

Sicherer Prüfungsbrowser

Sicherer Prüfungsbrowser

Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

SublimeText3 Englische Version

SublimeText3 Englische Version

Empfohlen: Win-Version, unterstützt Code-Eingabeaufforderungen!