Heim > Artikel > Backend-Entwicklung > PHP采集网页信息
【求助】PHP采集网页信息
需要采集
http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=*
不同UID的用户名
不熟悉PHP以及正则,只是单纯的想要结果,所以麻烦直接给出PHP代码和前1000个UID的用户名,谢谢。
$html = file_get_contents('http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=1');<br />preg_match('@<h2 class="xs2">(.*?)<\/h2>@',$html,$match);<br />//var_dump($match);<br />echo strip_tags($match[0]);
$url = 'http://bbs.zhanzhang.baidu.com/home.php?mod=space&uid=';<br /><br />$res = array();<br />$uid = 1;<br />while(count($res) < 20) { //获取前20个,自己根据需要修改<br /> if(preg_match('/<h2.+?h2>/s', file_get_contents($url.$uid), $r)){<br /> if(preg_match_all('/\w+/', strip_tags($r[0]), $r) == 3) {<br /> $res[$r[0][2]] = $r[0][0];<br /> }<br /> }<br /> $uid++;<br />}<br />print_r($res);<br />结果:(关联键为UID,值为用户名)