クローラーを使用して、58.com Recruitmentページのリアルタイムデータを取得するにはどうすればよいですか?
58.comの採用情報をクロールすると、問題が発生することがよくあります。ページに表示される申請者と視聴者の数はリアルタイムで更新されますが、Webページのソースコードは0として表示されますが、ブラウザー開発者ツール(F12)の要素パネルは正しいデータを表示します。これは、58.comがAjaxテクノロジーを使用してデータを非同期にロードするためです。この記事では、この動的データを取得する方法について説明します。
問題分析
北京の医療職を取り入れる例として、ページには応募者と視聴者の数がリアルタイムで表示されますが、ソースコードのデータは常に0であり、F12の要素パネルデータはページと一致しています。ソースコードから直接データを抽出することは機能しません。
解決
ページデータはAjaxリクエストを介して非同期にロードされており、これらのリクエストのJSONデータを見つけて取得する必要があります。
分析後、58.comは特定のAPIインターフェイスを使用してこれらのデータを提供します。例えば:
<code>https://statisticszp.58.com/position/totalcount/?infoId=27988...</code>
このインターフェイスは、JSONデータを返します。たとえば、
{ 「DeliveryCount」:1141、 「commentcount」:0、 「InfoCount」:4、 「resumereadpercent」:0、 "rebryll": ""、 「nexturl」:「null」 }
"deliveryCount"
は応募者の数を表し、 "infoCount"
訪問者の数を表します。
操作手順
- AJAXリクエストの配置:ブラウザ開発者ツール(F12)を使用して、ネットワークパネルのページダイナミックデータに関連するAJAX要求を見つけます。
- APIリクエストの送信: Crawler Tools(Pythonの
requests
ライブラリなど)を使用して、上記のAPIインターフェイスにGet Requestsを送信します。 - JSONデータの分析:返されたJSONデータから
"deliveryCount"
および"infoCount"
フィールドを抽出します。これは、リアルタイムで応募者と視聴者の数です。
上記の手順を通じて、58.com Recruitmentページのリアルタイムアプリケーションと視聴者のデータを正常に取得できます。 infoId
パラメーターは、ターゲットリクルートメントページに従って置き換える必要があることに注意してください。サーバーへの過度の圧力を避けるために、rawう頻度を制御してください。
以上が58.com作業ページでリアルタイムアプリケーションと視聴者のデータを取得する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于Seaborn的相关问题,包括了数据可视化处理的散点图、折线图、条形图等等内容,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于进程池与进程锁的相关问题,包括进程池的创建模块,进程池函数等等内容,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于简历筛选的相关问题,包括了定义 ReadDoc 类用以读取 word 文件以及定义 search_word 函数用以筛选的相关内容,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于数据类型之字符串、数字的相关问题,下面一起来看一下,希望对大家有帮助。

VS Code的确是一款非常热门、有强大用户基础的一款开发工具。本文给大家介绍一下10款高效、好用的插件,能够让原本单薄的VS Code如虎添翼,开发效率顿时提升到一个新的阶段。

本篇文章给大家带来了关于Python的相关知识,其中主要介绍了关于numpy模块的相关问题,Numpy是Numerical Python extensions的缩写,字面意思是Python数值计算扩展,下面一起来看一下,希望对大家有帮助。

pythn的中文意思是巨蟒、蟒蛇。1989年圣诞节期间,Guido van Rossum在家闲的没事干,为了跟朋友庆祝圣诞节,决定发明一种全新的脚本语言。他很喜欢一个肥皂剧叫Monty Python,所以便把这门语言叫做python。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

WebStorm Mac版
便利なJavaScript開発ツール

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

ドリームウィーバー CS6
ビジュアル Web 開発ツール

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ホットトピック



