搜索
首页php教程php手册使用Curl进行抓取远程内容时url中文编码问题

使用Curl进行抓取远程内容时url中文编码问题

Jun 13, 2016 am 10:59 AM
curlphpurl中文使用内容可以抓取编码进行远程问题

PHP中对于URL进行编码,可以使用 urlencode() 或者 rawurlencode(),二者的区别是前者把空格编码为 '+',而后者把空格编码为 '%20',不过应该注意的是,在编码时应该只对部分URL编码,否则URL中的冒号和反斜杠也会被转义。下面是详细解释:

 

 

1

string urlencode( string str)

返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。

 

例子 1 :urlencode函数与rawurlencode函数区别

 

 

$str='博 客';

echo urlencode($str);

echo "
";

echo rawurlencode($str);

url结果:

 

 

 

%B2%A9+%BF%CD

%B2%A9%20%BF%CD

例子 2 :url中文编码方法

从url:"http://www.baidu.com/s?wd=博 客"  

 

 

 

$url='http://www.baidu.com/s?wd=博 客';

$arr=explode('=',$url);

$url=$arr[0].'='.rawurlencode($arr[1]);

echo $url;

结果:

 

 

 

或许用以下url编码函数

 

 

 

function cn_urlencode($url){

     $pregstr = "/[\x{4e00}-\x{9fa5}]+/u";//UTF-8中文正则

    if(preg_match_all($pregstr,$url,$matchArray)){//匹配中文,返回数组

        foreach($matchArray[0] as $key=>$val){

            $url=str_replace($val, urlencode($val), $url);//将转译替换中文

        }

        if(strpos($url,' ')){//若存在空格

            $url=str_replace(' ','%20',$url);

        }

    }

    return $url;

}

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)