ホームページ  >  記事  >  バックエンド開発  >  PHPはWebページの情報を収集します

PHPはWebページの情報を収集します

WBOY
WBOYオリジナル
2016-06-13 12:53:33958ブラウズ

[ヘルプ] PHP は Web ページ情報を収集します
収集する必要があります
http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=*
異なる UID を持つユーザー名
PHP や正規表現には詳しくありませんが、結果だけが欲しいので、最初の 1000 個の UID の PHP コードとユーザー名を直接教えてください。

php
-----解決策---------
$html = file_get_contents('http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=1');<br />
preg_match('@<h2 class="xs2">(.*?)<\/h2>@',$html,$match);<br />
//var_dump($match);<br />
echo strip_tags($match[0]);

理論的には、uid は自動的に増加します。最初の 1000 は 1 ~ 1000 です。数値は自分で変更できます。
------解決策---------
$url = 'http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=';<br />
<br />
$res = array();<br />
$uid = 1;<br />
while(count($res) < 20) { //获取前20个,自己根据需要修改<br />
  if(preg_match('/<h2.+?h2>/s', file_get_contents($url.$uid), $r)){<br />
    if(preg_match_all('/\w+/', strip_tags($r[0]), $r) == 3) {<br />
      $res[$r[0][2]] = $r[0][0];<br />
    }<br />
  }<br />
  $uid++;<br />
}<br />
print_r($res);<br />
結果: (関連付けられたキーは UID です、値はユーザー名です)

配列
(
[1] => サイトマップbbs
[7] =>
[8] => サイトマップテスト2
[9] => サイトマップテスト
[10] => サイトマップテスト32
[13] => サイトマップテスト3
[14] =>kkkスーパー
[16] => 05
[17] =>caoli456
[18] =>ワンビン_イヴァン
[19] =>ゲイウォソウ
[20] => サイトマップ_テスト1
[21] => サイトマップ_テスト5
[22] =>
[23] =>lkmmmmj
[24] =>ブラックフォックス1983
[25] =>ドンベイ_wb
[26] =>キシズリンガー
[27] =>サンウシュオシ
[28] =>007
)

-----解決策----------------------------
上記と同じですが、file_get_contents メソッドは遅すぎるため、
を使用できます。
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。