


Wie bekomme ich die richtige Anzahl von Bewerbern und Zuschauern, wenn Sie auf der Arbeitsplatzseite 58.com kriechen?
58.com Rekrutierungsinformationen Crawling: Lösen Sie das Problem inkonsistenter Daten von Bewerbern und Zuschauern
Wenn Sie auf der Rekrutierungsseite 58.com Crawling auf ein schwieriges Problem stoßen: Die Anzahl der Bewerber und die Anzahl der vom Webseiten angezeigten Zuschauer stimmen nicht mit den auf der Seite angezeigten Daten überein, und der Quellcode wird häufig als 0 angewendet, während die Daten in Echtzeit auf der Seite mit dem Element -Inhalt des Browser -Entwicklungs -Tools (F12) übereinstimmen. In diesem Artikel wird untersucht, wie dieses Problem gelöst und genaue Bewerber und Zuschauer erhalten werden.
Problemanalyse:
Um zu verhindern, dass Daten böswillig gekrabbelt werden, übernahm 58.com die Methode zum dynamischen Laden von Daten. Die Anzahl der Bewerber und Zuschauer auf der Seite wird nicht direkt aus dem HTML -Quellcode erhalten, sondern asynchron über JavaScript geladen. Daher kann der direkte Parsen -HTML -Quellcode nicht die richtigen Daten abrufen.
Lösung:
Um die korrekte Anzahl von Bewerbern und Zuschauern zu erhalten, müssen Sie die von 58.com bereitgestellte API -Schnittstelle finden. Durch die Analyse von Netzwerkanfragen können wir eine API -Schnittstelle zum Erhalten von Rekrutierungsinformationsstatistiken finden, wobei eine URL dem folgenden Format ähnelt:
<code>https://statisticszp.58.com/position/totalcount/?infoId=27988...</code>
Der infoId
-Parameter repräsentiert die spezifische Positions -ID und muss basierend auf der URL der Zielrekrutierungsseite extrahiert werden.
API gibt Datenbeispiel zurück:
Die von der API -Schnittstelle zurückgegebenen JSON -Daten enthält die Informationen, die wir benötigen:
{ "DeliveryCount": 1141, // Anzahl der Bewerber "Kommentar": 0,, "Infocount": 4, // Anzahl der Zuschauer "Lebensleitungen": 0,, "Referenurl": "", "Nexturl": "null" }
Das Feld deliveryCount
gibt die Anzahl der Bewerber an, und das infoCount
-Feld zeigt die Anzahl der Zuschauer an.
Implementierungsschritte:
Get Job ID (Infoid): Analysieren Sie die URL der Zielrekrutierungsseite und finden Sie den Parameterwert, der der Job -ID entspricht. Dies kann die Verwendung regelmäßiger Ausdrücke oder anderer String -Verarbeitungsmethoden erfordern.
Konstrukte API -Anforderungs -URL: Ersetzen Sie die extrahierte
infoId
in die URL -URL -Vorlage für API, um eine vollständige API -Anforderungs -URL zu bilden.Senden Sie API -Anfragen: Verwenden Sie
requests
von Python oder andere HTTP -Clients, um GET -Anfragen an die API -URL zu senden.Analysieren Sie JSON -Daten: Analysieren Sie die von der API zurückgegebenen JSON -Daten in ein Python -Wörterbuch, extrahieren Sie die Werte von
deliveryCount
undinfoCount
, dh die korrekte Anzahl von Bewerbern und die Anzahl der Zuschauer.
In den oben genannten Schritten können Sie den dynamischen Lademechanismus der Webseite von 58.com umgehen und die Anzahl der Bewerber und Zuschauer auf der Rekrutierungsseite genau erhalten. Bitte beachten Sie, dass sich die Adresse und die Parameternamen der API -Schnittstelle ändern können und gemäß den tatsächlichen Bedingungen angepasst werden müssen. Gleichzeitig halten Sie sich bitte an die Regeln von Robots.txt von 58.com, um einen übermäßigen Druck auf den Server zu vermeiden.
Das obige ist der detaillierte Inhalt vonWie bekomme ich die richtige Anzahl von Bewerbern und Zuschauern, wenn Sie auf der Arbeitsplatzseite 58.com kriechen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

HTML, CSS und JavaScript sind die Kerntechnologien zum Erstellen moderner Webseiten: 1. HTML Definiert die Webseitenstruktur, 2. CSS ist für das Erscheinen der Webseite verantwortlich.

Die Funktion von HTML besteht darin, die Struktur und den Inhalt einer Webseite zu definieren, und der Zweck besteht darin, eine standardisierte Möglichkeit zur Anzeige von Informationen bereitzustellen. 1) HTML organisiert verschiedene Teile der Webseite über Tags und Attribute wie Titel und Absätze. 2) Es unterstützt die Trennung von Inhalten und Leistung und verbessert die Wartungseffizienz. 3) HTML ist erweiterbar, sodass benutzerdefinierte Tags SEO verbessern können.

Die zukünftigen Trends von HTML sind Semantik und Webkomponenten, die zukünftigen Trends von CSS sind CSS-in-JS und CssShudini, und die zukünftigen Trends von JavaScript sind WebAssembly und serverlos. 1. HTML -Semantik verbessern die Zugänglichkeits- und SEO -Effekte sowie Webkomponenten die Entwicklungseffizienz, aber der Browserkompatibilität sollte die Aufmerksamkeit geschenkt werden. 2. CSS-in-JS verbessert die Flexibilität des Stilmanagements, kann jedoch die Dateigröße erhöhen. CssShudini ermöglicht den direkten Betrieb des CSS -Renderings. 3.Webassembly optimiert die Browser -Anwendungsleistung, verfügt jedoch über eine steile Lernkurve, und serverloses vereinfacht die Entwicklung, erfordert jedoch eine Optimierung von Kaltstartproblemen.

Die Rollen von HTML, CSS und JavaScript in der Webentwicklung sind: 1. HTML definiert die Webseitenstruktur, 2. CSS steuert den Webseitenstil, und 3. JavaScript fügt ein dynamisches Verhalten hinzu. Zusammen bauen sie den Rahmen, die Ästhetik und die Interaktivität moderner Websites auf.

Die Zukunft von HTML ist voller unendlicher Möglichkeiten. 1) Neue Funktionen und Standards umfassen mehr semantische Tags und die Beliebtheit von Webcomponenten. 2) Der Webdesign -Trend entwickelt sich weiterhin für reaktionsschnelles und zugängliches Design. 3) Die Leistungsoptimierung verbessert die Benutzererfahrung durch reaktionsschnelle Bildlade- und faulen Ladetechnologien.

Die Rollen von HTML, CSS und JavaScript in der Webentwicklung sind: HTML ist für die Inhaltsstruktur verantwortlich, CSS ist für den Stil verantwortlich und JavaScript ist für dynamisches Verhalten verantwortlich. 1. HTML definiert die Webseitenstruktur und den Inhalt durch Tags, um die Semantik zu gewährleisten. 2. CSS steuert den Webseitenstil über Selektoren und Attribute, um es schön und einfach zu lesen. 3. JavaScript steuert das Verhalten von Webseiten über Skripte, um dynamische und interaktive Funktionen zu erzielen.

HtmlisnotaprogrammingLanguage; itiSamarkuplanguage.1) htmlstructuresandFormatswebcontentuses.2) itWorkswithCSSForstylingandjavaScriptForinteraktivität, EnhancingWebDevelopment.

HTML ist der Eckpfeiler der Erstellung von Webseitenstruktur. 1. HTML definiert die Inhaltsstruktur und die Semantik und Verwendung usw. Tags. 2. Stellen Sie semantische Marker wie usw. zur Verfügung, um den SEO -Effekt zu verbessern. 3. Um die Benutzerinteraktion durch Tags zu verwirklichen, achten Sie auf die Verifizierung der Form. 4. Verwenden Sie fortschrittliche Elemente wie in Kombination mit JavaScript, um dynamische Effekte zu erzielen. 5. Zu den häufigen Fehlern gehören nicht abgegebene Bezeichnungen und nicht geeignete Attributwerte, und Überprüfungstools sind erforderlich. 6. Optimierungsstrategien umfassen das Reduzieren von HTTP -Anforderungen, die Komprimierung von HTML, die Verwendung semantischer Tags usw.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

MinGW – Minimalistisches GNU für Windows
Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

VSCode Windows 64-Bit-Download
Ein kostenloser und leistungsstarker IDE-Editor von Microsoft

Sicherer Prüfungsbrowser
Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

SublimeText3 Englische Version
Empfohlen: Win-Version, unterstützt Code-Eingabeaufforderungen!