>  기사  >  백엔드 개발  >  PHP香港服务器用file_get_contents 抓取天猫的数据都是繁体的

PHP香港服务器用file_get_contents 抓取天猫的数据都是繁体的

WBOY
WBOY원래의
2016-06-23 14:38:35864검색


我在香港服务器上用file_get_contents 抓取的天猫的数据都是繁体的;

我不想用繁转简的方法,我想抓取过来就是简体的,怎么设置比较好呢?

如果用curl,那我也不太懂curl的内容为何直接输出页面了,怎么不让他输出,只是赋值给变量呢?

curl_setopt($ch, CURLOPT_FOLLOWLOCATION,1); 	curl_setopt($ch, CURLOPT_HEADER, true);	$contents = curl_exec($ch);


回复讨论(解决方案)

可能是因为你的服务器默认语言是中文繁体,天猫自动加载的繁体版的。
你更改一下你服务器的默认语言啊!

或者在PHP里试一下 
setlocale(LC_ALL, "zh_CN.UTF-8")

可能是因为你的服务器默认语言是中文繁体,天猫自动加载的繁体版的。
你更改一下你服务器的默认语言啊!

或者在PHP里试一下 
setlocale(LC_ALL, "zh_CN.UTF-8")

不是的,我服务器设置的是简体的;

可能是因为天猫识别到访问者ip是香港的,香港那边是用繁体,所以给展示的就是繁体

那你设置下代理试试。

如果用curl,那我也不太懂curl的内容为何直接输出页面了,怎么不让他输出,只是赋值给变量呢?
加上下面这句:
 curl_setopt($ch, CURLOPT_RETURNTRANSFERR, true);

那你设置下代理试试。

如果用curl,那我也不太懂curl的内容为何直接输出页面了,怎么不让他输出,只是赋值给变量呢?
加上下面这句:
 curl_setopt($ch, CURLOPT_RETURNTRANSFERR, true);

谢谢,你说的对,curl_setopt($ch, CURLOPT_FOLLOWLOCATION,1); 这样就能赋值给变量了

不过没有代理资源,对这方面也不太懂,鉴于还有其他问题,我们就直接换到用国内服务器了


可能是因为你的服务器默认语言是中文繁体,天猫自动加载的繁体版的。
你更改一下你服务器的默认语言啊!

或者在PHP里试一下 
setlocale(LC_ALL, "zh_CN.UTF-8")

不是的,我服务器设置的是简体的;

可能是因为天猫识别到访问者ip是香港的,香港那边是用繁体,所以给展示的就是繁体

用代理,比如你抓取“CNZZ的查看网页输出”。



可能是因为你的服务器默认语言是中文繁体,天猫自动加载的繁体版的。
你更改一下你服务器的默认语言啊!

或者在PHP里试一下 
setlocale(LC_ALL, "zh_CN.UTF-8")

不是的,我服务器设置的是简体的;

可能是因为天猫识别到访问者ip是香港的,香港那边是用繁体,所以给展示的就是繁体

用代理,比如你抓取“CNZZ的查看网页输出”。

代理,不会用,抓取“CNZZ的查看网页输出”是什么意思?




可能是因为你的服务器默认语言是中文繁体,天猫自动加载的繁体版的。
你更改一下你服务器的默认语言啊!

或者在PHP里试一下 
setlocale(LC_ALL, "zh_CN.UTF-8")

不是的,我服务器设置的是简体的;

可能是因为天猫识别到访问者ip是香港的,香港那边是用繁体,所以给展示的就是繁体

用代理,比如你抓取“CNZZ的查看网页输出”。

代理,不会用,抓取“CNZZ的查看网页输出”是什么意思?

抓取 “CNZZ查看网页输出”的这个网址的内容,参数换成你的要采集的网址。
http://tool.chinaz.com/Tools/PageCode.aspx?q=

学习了,日后有用

CURLOPT_USERAGENT

http://blog.csdn.net/jdgdf566/article/details/13632111

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.