Heim >Backend-Entwicklung >PHP-Tutorial >php使用curl获取跳转后的网址
使用curl获取跳转后网址时,如果直接设置网址能够成功获取到,将网址赋值给变量,在使用变量传给curl就获取不到
<code>$ch= curl_init("http://www.baidu.com"); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_AUTOREFERER, 1); curl_setopt($ch, CURLOPT_NOBODY, 1); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_HEADER, 1); curl_exec($ch); $aaa = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL); echo $aaa;</code>
以上代码能够获取到跳转后的网址;下面的写法就获取不到,获取到的是一个显示错误信息的页面网址;
<code>$url="http://www.baidu.com"; $ch = curl_init($url); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_AUTOREFERER, 1); curl_setopt($ch, CURLOPT_NOBODY, 1); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_HEADER, 1); curl_exec($ch); $aaa = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL); echo $aaa;</code>
使用curl获取跳转后网址时,如果直接设置网址能够成功获取到,将网址赋值给变量,在使用变量传给curl就获取不到
<code>$ch= curl_init("http://www.baidu.com"); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_AUTOREFERER, 1); curl_setopt($ch, CURLOPT_NOBODY, 1); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_HEADER, 1); curl_exec($ch); $aaa = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL); echo $aaa;</code>
以上代码能够获取到跳转后的网址;下面的写法就获取不到,获取到的是一个显示错误信息的页面网址;
<code>$url="http://www.baidu.com"; $ch = curl_init($url); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_AUTOREFERER, 1); curl_setopt($ch, CURLOPT_NOBODY, 1); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_HEADER, 1); curl_exec($ch); $aaa = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL); echo $aaa;</code>
和这个是否通过变量初始化肯定是没关系的!
我运行你两段代码得到的结果是一样的,可能是特定版本的PHP或者libcurl中的问题,你可以抓包看看实际发了什么请求出去,服务器返回什么。
你在测试的时候,是放在一起测试的吧,记得close上一个,版本也不会有这个问题的(至少我没遇到过)
感谢各位的回答,由于我描述的不清晰,使大家没有发现问题出现的原因。晚上看了一会,找到了原因。我是通过手机百度搜索关键词,然后抓取搜索结果页面中特定的网址,由于我是在抓取成功后把网址打印到页面上,所以看不出网址有什么问题,当我查看页面源码的时候发现链接中的&字符被替换成了&,我将&替换成&后就正常了,能够得到想要的结果。