クローラーを使用して、58.com Recruitmentページのリアルタイムデータを取得するにはどうすればよいですか?
58.comの採用情報をクロールすると、問題が発生することがよくあります。ページに表示される申請者と視聴者の数はリアルタイムで更新されますが、Webページのソースコードは0として表示されますが、ブラウザー開発者ツール(F12)の要素パネルは正しいデータを表示します。これは、58.comがAjaxテクノロジーを使用してデータを非同期にロードするためです。この記事では、この動的データを取得する方法について説明します。
問題分析
北京の医療職を取り入れる例として、ページには応募者と視聴者の数がリアルタイムで表示されますが、ソースコードのデータは常に0であり、F12の要素パネルデータはページと一致しています。ソースコードから直接データを抽出することは機能しません。
解決
ページデータはAjaxリクエストを介して非同期にロードされており、これらのリクエストのJSONデータを見つけて取得する必要があります。
分析後、58.comは特定のAPIインターフェイスを使用してこれらのデータを提供します。例えば:
<code>https://statisticszp.58.com/position/totalcount/?infoId=27988...</code>
このインターフェイスは、JSONデータを返します。たとえば、
{ 「DeliveryCount」:1141、 「commentcount」:0、 「InfoCount」:4、 「resumereadpercent」:0、 "rebryll": ""、 「nexturl」:「null」 }
"deliveryCount"
は応募者の数を表し、 "infoCount"
訪問者の数を表します。
操作手順
- AJAXリクエストの配置:ブラウザ開発者ツール(F12)を使用して、ネットワークパネルのページダイナミックデータに関連するAJAX要求を見つけます。
- APIリクエストの送信: Crawler Tools(Pythonの
requests
ライブラリなど)を使用して、上記のAPIインターフェイスにGet Requestsを送信します。 - JSONデータの分析:返されたJSONデータから
"deliveryCount"
および"infoCount"
フィールドを抽出します。これは、リアルタイムで応募者と視聴者の数です。
上記の手順を通じて、58.com Recruitmentページのリアルタイムアプリケーションと視聴者のデータを正常に取得できます。 infoId
パラメーターは、ターゲットリクルートメントページに従って置き換える必要があることに注意してください。サーバーへの過度の圧力を避けるために、rawう頻度を制御してください。
以上が58.com作業ページでリアルタイムアプリケーションと視聴者のデータを取得する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Web開発におけるHTML、CSS、およびJavaScriptの役割は次のとおりです。1。HTMLは、Webページ構造の構築に使用されます。 2。CSSは、Webページの外観を美化するために使用されます。 3. JavaScriptは、動的な相互作用を実現するために使用されます。タグ、スタイル、スクリプトを通じて、これら3つは最新のWebページのコア関数を構築します。

タグのLang属性を設定することは、WebアクセシビリティとSEOを最適化する重要なステップです。 1)ラング属性をタグに設定します。 2)多言語コンテンツでは、ようなさまざまな言語パーツのLang属性を設定します。 3)「EN」、「FR」、「ZH」などのISO639-1標準に準拠する言語コードを使用します。Lang属性を正しく設定すると、Webページと検索エンジンランキングのアクセシビリティが向上します。

htmlattributeSareSientionalentionalentionalentionalentiallyance'functionalityandappearance.theyaddinformationtodefinebehavior、light、and interaction、makewebsitesteractive、responsive、andviseallyappaleal.attributeslikesrc、href、class、型、およびdoadabledransform

toreatealistinhtml、useforunorderedlistsandfororderedlists:1)forunorderedlists、wrapitemsinanduseforeachitem、renderingasabulletedlist.2)

HTMLは、明確な構造のWebサイトを構築するために使用されます。 1)Webサイト構造などのタグを使用し、定義します。 2)例は、ブログとeコマースのウェブサイトの構造を示しています。 3)誤ったラベルネスティングなどの一般的な間違いを避けてください。 4)HTTP要求を削減し、セマンティックタグを使用してパフォーマンスを最適化します。

to inertanimageintoanhtmlpage、usethetagwithsrcandaltattributes.1)usealttextforaccessibilityandseo.2)emplencesrcsetForresponsiveimages.3)applylazyloadingwithloading = "lazy" tooptimizeperformance.4)

HTMLの中心的な目的は、ブラウザがWebコンテンツを理解して表示できるようにすることです。 1。HTMLは、タグなどのタグを介してWebページの構造とコンテンツを定義します。 3.HTMLは、ユーザーの相互作用をサポートするフォーム要素を提供します。 4. HTMLコードの最適化は、HTTP要求の削減やHTMLの圧縮など、Webページのパフォーマンスを改善できます。

htmltagsareSterenceforwebdevelovementasyStheStructureanhandhancewebpages.1)theydefineLayout、semantics、and-interactivity.2)semanticagsimprovecessibility.3)opeusofusofagscanoptimizeperformanceandensurecross-brows-compativeation。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)
