夜は休みだったので、良い映画を2本観ようと思いました
見たいものが見つかりません
。以前誰かが Zhihu のユーザーデータをクロールしたことがあると思いました、
BT Paradise の映画情報をクロールしても大丈夫です 今度はデータベースを直接確認できます。
とても退屈としか言えません、はは、まだコーディングできます ^_^
1. WebサイトのHTMLソースコードを取得します
<span style="font-size:24px;">$url = "www.bttiantang.cc"; $html = shell_exec("curl $url");</span>
<span style="font-size:24px;">preg_match("/<span class=\"pageinfo\">.*?<\/span>/", $html, $pageCount); preg_match_all("/\d{1,10000}/",$pageCount[0],$pageCount);</span>
3. キャプチャ動画情報(定期マッチング情報)
りー
一般的に、PHP のクロール速度は非常に速く、20,000 件以上の情報を収集するのに 4 分もかかりません。
start:01:22:54
end:01:26:11
添付データベースのスクリーンショット:
添付ソースコード:
<span style="font-size:24px;">preg_match("/\d{4}\/\d{2}\/\d{2}/" , $pageInfo[0][$i], $updateTime); preg_match("/<font color=\"#FF6600\">(.*?)<i>/" , $pageInfo[0][$i], $movieName); preg_match("/<strong>(\d{1})<\/strong>/" , $pageInfo[0][$i], $movieScore_int); preg_match("/<em class=\"fm\">(\d{1})<\/em>/" , $pageInfo[0][$i], $movieScore_decimal); preg_match("/href=\"(.*?)\"/" , $pageInfo[0][$i], $movieUrl); preg_match("/<p class=\"des\">(.*?)<\/p>/" , $pageInfo[0][$i], $actor); </span>
この映画情報はBT Paradiseから取得したものであり、機密情報は含まれません従って、私はいかなる法的責任も負いません。
あなたの著作権、知的財産権、その他の利益に関わる関連映画情報がある場合は、お知らせください。確認後、できるだけ早く削除されます。