ホームページ  >  記事  >  バックエンド開発  >  BTパラダイスのムービーデータの取得方法

BTパラダイスのムービーデータの取得方法

WBOY
WBOYオリジナル
2016-07-30 13:30:523041ブラウズ

夜は休みだったので、良い映画を2本観ようと思いました

見たいものが見つかりませんBTパラダイスのムービーデータの取得方法

。以前誰かが Zhihu のユーザーデータをクロールしたことがあると思いましたBTパラダイスのムービーデータの取得方法

BT Paradise の映画情報をクロールしても大丈夫です 今度はデータベースを直接確認できます。 BTパラダイスのムービーデータの取得方法BTパラダイスのムービーデータの取得方法

とても退屈としか言えませんBTパラダイスのムービーデータの取得方法、はは、まだコーディングできます ^_^


1. WebサイトのHTMLソースコードを取得します

<span style="font-size:24px;">$url = "www.bttiantang.cc";
$html = shell_exec("curl $url");</span>

2.ページ数、動画総数(定期マッチング)

<span style="font-size:24px;">preg_match("/<span class=\"pageinfo\">.*?<\/span>/", $html, $pageCount);
preg_match_all("/\d{1,10000}/",$pageCount[0],$pageCount);</span>

3. キャプチャ動画情報(定期マッチング情報)

りー


4.データベースに挿入すれば完了です

一般的に、PHP のクロール速度は非常に速く、20,000 件以上の情報を収集するのに 4 分もかかりません。

start:01:22:54

end:01:26:11



添付データベースのスクリーンショット:



添付ソースコード:

<span style="font-size:24px;">preg_match("/\d{4}\/\d{2}\/\d{2}/" , $pageInfo[0][$i], $updateTime);

preg_match("/<font color=\"#FF6600\">(.*?)<i>/" , $pageInfo[0][$i], $movieName);
        
preg_match("/<strong>(\d{1})<\/strong>/" , $pageInfo[0][$i], $movieScore_int);
     
preg_match("/<em class=\"fm\">(\d{1})<\/em>/" , $pageInfo[0][$i], $movieScore_decimal);
        
preg_match("/href=\"(.*?)\"/" , $pageInfo[0][$i], $movieUrl);
      
preg_match("/<p class=\"des\">(.*?)<\/p>/" , $pageInfo[0][$i], $actor);
       </span>

この映画情報はBT Paradiseから取得したものであり、機密情報は含まれません従って、私はいかなる法的責任も負いません。

あなたの著作権、知的財産権、その他の利益に関わる関連映画情報がある場合は、お知らせください。確認後、できるだけ早く削除されます。

著作権表示: この記事はブロガーによるオリジナルの記事であり、ブロガーの許可なく複製することはできません。

上記では、BT Paradise のムービー データをキャプチャする方法と、関連する内容を紹介しました。PHP チュートリアルに興味のある友人に役立つことを願っています。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。