Heim > Artikel > Backend-Entwicklung > 怎么用PHP抓取网站HTML
连接地址
http://detail.tmall.com/item.htm?spm=a230r.1.0.0.MlI5e4&id=40364502055&ad_id=&am_id=&cm_id=140105335569ed55e27b&pm_id=&abbucket=12
file_get_contents() 成功了呀
你可以采用楼上的写法 也可以采用curl来获取,最重要的是要看你啥需求。
查一下php手册中的curl
多测试几次filegetcontents,实在不行就curl
一般就是伪造useragent和referer,也许再带个cookie
可以抓取到的 还可以根据对应的字符闭合段去进行抓取
<?php $url="http://detail.tmall.com/item.htm?spm=a230r.1.0.0.MlI5e4&id=40364502055&ad_id=&am_id=&cm_id=140105335569ed55e27b&pm_id"; $content = getcurl($url); echo $content; function getcurl($url){ $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_FOLLOWLOCATION,true); curl_setopt($ch, CURLOPT_MAXREDIRS,20); $file_contents = curl_exec($ch); return $file_contents; curl_close($ch); }?>
非常感谢你啊