Home  >  Article  >  Backend Development  >  curl爬取页面出现invalid host是什么原因?

curl爬取页面出现invalid host是什么原因?

WBOY
WBOYOriginal
2016-06-06 20:24:281737browse

<code><?php //$curl=curl_init('http://www.baidu.com');//爬取正常
$curl=curl_init('http://jw.dhu.edu.cn/dhu/login_wz.jsp');//invalid host

curl_exec($curl);
curl_close($curl);
?></code>

我们学校教务处的网站jw.dhu.edu.cn/dhu/login_wz.jsp这个地址通过curl爬取时,返回INVALID HOST,目前测试的其他网站都可以正常爬取,是什么原因?我怀疑是学校网站禁止了访问请求?
另,在阿里云上出现同样错误,应该不是新浪云的问题。curl爬取页面出现invalid host是什么原因?

回复内容:

<code><?php //$curl=curl_init('http://www.baidu.com');//爬取正常
$curl=curl_init('http://jw.dhu.edu.cn/dhu/login_wz.jsp');//invalid host

curl_exec($curl);
curl_close($curl);
?></code>

我们学校教务处的网站jw.dhu.edu.cn/dhu/login_wz.jsp这个地址通过curl爬取时,返回INVALID HOST,目前测试的其他网站都可以正常爬取,是什么原因?我怀疑是学校网站禁止了访问请求?
另,在阿里云上出现同样错误,应该不是新浪云的问题。curl爬取页面出现invalid host是什么原因?

无效主机名,域名解析有问题。

这个地址可能是配在dns上面的,只能你们校园网内部访问,在外网和sinaapp上面访问不了。

测试了很多次,学校网站也可以正常访问,是不是被反爬虫了?

用户名或密码不能为空!

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn