>백엔드 개발 >PHP 튜토리얼 >为何curl或file_get_contents采集url时k数过高则不能获取?

为何curl或file_get_contents采集url时k数过高则不能获取?

WBOY
WBOY원래의
2016-06-23 14:20:48946검색

之前通过http://bbs.csdn.net/topics/390572750得知了获取方式,但有的链接如下:
http://www.autohome.com.cn/77/options.html
http://www.autohome.com.cn/59/options.html
都可正常获取
但以下链接:
http://www.autohome.com.cn/146/options.html
http://www.autohome.com.cn/317/options.html
则获取为空,不知道是何原因,目前个人看是能获取的页面K数要小于不能获取的页
求各位高手帮忙,看是什么问题?  小弟用的是lnmp


回复讨论(解决方案)

确认html获取到了,但通过正则不能获取到指定部分(url html字节大时)

都在30~35k,不可能是获取的问题,肯定是你的正则写得有问题

看下你的正则吧,是不是有些情况无法匹配。你自己都说已经获取到HTML了,那问题很好定位了

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.