Parsing the escape function in php_PHP tutorial-PHP Tutorial-php.cn

Home

Backend Development

PHP Tutorial

Parsing the escape function in php_PHP tutorial

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jul 21, 2016 pm 03:02 PM

escapehrefphpurl。functionrightChinese charactercodingparseconductuse

Use js to escape encode the Chinese characters in the URL.
The effect after clicking the link is:
Quote: http://127.0.0.1/shop/product_list.php?p_sort=PHP%u5F00%u53D1%u8D44%u6E90%u7F51
To generate such an effect, it is obvious to use PHP's urldecode() or base64_decode() cannot be decoded.
Solution, use PHP to write an inverse solution function:

Copy the code The code is as follows:

function js_unescape($str){
{ str, $i+2, 4)); 0xc0|($val>>6)).chr(0x80|($val&0x3f)); >6)&0x3f)).chr(0x80|($val&0x3f)); == '%') 🎜>{
else $ret .= $str[$i ]; But if you use UTF-8 encoding, this step is not necessary.

The code is as follows: print iconv('utf-8', 'gb2312', js_unescape($_REQUEST['p_sort']));

At this point we have successfully decoded js The escape is encoded.
As follows:
In addition, I found a function that uses PHP to implement escape encoding of js:

Copy the code

The code is as follows:

function phpescape($str)
{         
$sublen=strlen($str);
      $retrunString="";         
for ($i=0;$i{                  
if(ord($str[$i])>=127)                  
{                           
$tmpString=bin2hex(iconv("gb2312","ucs-2",substr($str,$i,2)));                           
//$tmpString=substr($tmpString,2,2).substr($tmpString,0,2);window下可能要打开此项                           
$retrunString.="%u".$tmpString;                           
$i++;                  
} else 
{                           
$retrunString.="%".dechex(ord($str[$i]));                  
}         
}         
return $retrunString;
}

在json中不支持中文，用它传送中文数据就会出现数据丢失或者乱码，必须在传送前对要发送的字符串进行编码，由于传送过去需要用js进行数据解析，考虑到js中有unescape函数，故若在php中有个escape函数，对数据进行编码，在客户端用unescape进行解码，这样就会方便很多。
先在网上搜索一把，很多用php实现的escape函数，大同小异，比如下面一个：

复制代码代码如下:

function phpEscape($str) {
preg_match_all("/[x80-xff].|[x01-x7f]+/",$str,$r);
$ar = $r[0];
foreach($ar as $k=>$v) {
    if(ord($v[0])       $ar[$k] = rawurlencode($v);
    else
      $ar[$k] = "%u".bin2hex(iconv("GB2312","UCS-2",$v));
}
return join("",$ar);
}

这个函数可以很好的工作，但是，也许有新手不理解这个函数的原理(比如我)，用起来总是不放心，现在我就来解释一下这个函数的原理。而且我认为，拿别人的代码来复用，好比站在了巨人的肩膀上，但是若不理解别人的代码，迟早要掉到地面上。
第一句：preg_match_all("/[x80-xff].|[x01-x7f]+/",$str,$r);这个是用正则表达式匹配字符串中所有的字符，[x80-xff]. 匹配的是汉字，x表示匹配字符的16进制编码，[ ] 是类选择符，“.” 表示任意一个字符，这样[x80-xff].匹配的是两个字符，其中第一个就是16进制从80到ff的字符，而这恰好就是汉字编码的第一个字符。这样就能完整的匹配一个汉字。关于unicode中汉字的编码，大家可以到网上搜索一下。同理，[x01-x7f]+英文字符串，因为最早的英文是 ASCII编码，编码值小于128，也就是16进制的从01到7f，"+"表示一个或者多个字符，这样[x01-x7f]+就能匹配连续多个英文字符串。

复制代码代码如下:

$ar = $r[0]; //$r[0] stores the matched array
foreach($ar as $k=>$v) {
 if (ord($v[0])  $ar[$k] = rawurlencode($v); //Use rawurlencode to encode directly
 else
 $ar[$k] = "%u".bin2hex(iconv("GB2312","UCS-2",$v)); // Otherwise, use the iconv function to convert Chinese characters into ucs-2 Encoding, that is, unicode encoding 
}

can be decoded with unescape in javascript
u0391-uFFE5 and u4e00-u9fa5 to match Chinese
but it seems that the former contains Chinese characters The latter A-￥ and so on below may be pure Chinese characters.
The decoding function is:

Copy code The code is as follows:

function unescape($str) {
 $str = rawurldecode($str);
 preg_match_all("/%u.{4}|.{4};|d+;|.+/U",$str,$r); 
 $ar = $r[0];
 foreach($ar as $k=>$v) {
 if(substr($v,0,2) == "%u") 
                     $ar[$k] = iconv("UCS-2","GBK",pack("H4",substr($v,-4))); ,3) == "")
                                                                                       );
                  elseif(substr($v,0,2) == "") { ",substr($v,2,-1)));
 }
 }
 return join("",$ar);
}

1. Encoding range1. GBK (GB2312/GB18030)
x00-xff GBK double-byte encoding range
x20-x7f ASCIIxa1- xff Chinese
x80-xff Chinese

2. UTF-8 (Unicode)
u4e00-u9fa5 (Chinese)
x3130-x318F (KoreanxAC00-xD7A3 ( Korean)
u0800-u4e00 (Japanese)
ps: Korean is a character larger than [u9fa5]

Regular example:
preg_replace("/([x80-xff]) /","",$str);
preg_replace("/([u4e00-u9fa5])/","",$str);

http://www.bkjia.com/PHPjc/327931.html

Statement

The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn

Python解析XML中的特殊字符和转义序列Aug 08, 2023 pm 12:46 PM

Python解析XML中的特殊字符和转义序列XML（eXtensibleMarkupLanguage）是一种常用的数据交换格式，用于在不同系统之间传输和存储数据。在处理XML文件时，经常会遇到包含特殊字符和转义序列的情况，这可能会导致解析错误或者误解数据。因此，在使用Python解析XML文件时，我们需要了解如何处理这些特殊字符和转义序列。一、特殊字符和

Python编程解析百度地图API文档中的坐标转换功能Aug 01, 2023 am 08:57 AM

Python编程解析百度地图API文档中的坐标转换功能导读：随着互联网的快速发展，地图定位功能已经成为现代人生活中不可或缺的一部分。而百度地图作为国内最受欢迎的地图服务之一，提供了一系列的API供开发者使用。本文将通过Python编程，解析百度地图API文档中的坐标转换功能，并给出相应的代码示例。一、引言在开发中，我们有时会涉及到坐标的转换问题。百度地图AP

PHP8.0中的XML解析库May 14, 2023 am 08:19 AM

随着PHP8.0的发布，许多新特性都被引入和更新了，其中包括XML解析库。PHP8.0中的XML解析库提供了更快的解析速度和更好的可读性，这对于PHP开发者来说是一个重要的提升。在本文中，我们将探讨PHP8.0中的XML解析库的新特性以及如何使用它。什么是XML解析库？XML解析库是一种软件库，用于解析和处理XML文档。XML是一种用于将数据存储为结构化文档

使用Python解析SOAP消息Aug 08, 2023 am 09:27 AM

使用Python解析SOAP消息SOAP（SimpleObjectAccessProtocol）是一种基于XML的远程过程调用（RPC）协议，用于在网络上不同的应用程序之间进行通信。Python提供了许多库和工具来处理SOAP消息，其中最常用的是suds库。suds是Python的一个SOAP客户端库，可以用于解析和生成SOAP消息。它提供了一种简单而

使用Python解析带有命名空间的XML文档Aug 09, 2023 pm 04:25 PM

使用Python解析带有命名空间的XML文档XML是一种常用的数据交换格式，能够适应各种应用场景。在处理XML文档时，有时会遇到带有命名空间（namespace）的情况。命名空间可以防止不同XML文档中元素名的冲突，提高了XML的灵活性和可扩展性。本文将介绍如何使用Python解析带有命名空间的XML文档，并给出相应的代码示例。首先，我们需要导入xml.et

PHP中的HTTP Basic鉴权方法解析及应用Aug 06, 2023 am 08:16 AM

PHP中的HTTPBasic鉴权方法解析及应用HTTPBasic鉴权是一种简单但常用的身份验证方法，它通过在HTTP请求头中添加用户名和密码的Base64编码字符串进行身份验证。本文将介绍HTTPBasic鉴权的原理和使用方法，并提供PHP代码示例供读者参考。一、HTTPBasic鉴权原理HTTPBasic鉴权的原理非常简单，当客户端发送一个请求时

PHP 爬虫实战之获取网页源码和内容解析Jun 13, 2023 am 10:46 AM

PHP爬虫是一种自动化获取网页信息的程序，它可以获取网页代码、抓取数据并存储到本地或数据库中。使用爬虫可以快速获取大量的数据，为后续的数据分析和处理提供巨大的帮助。本文将介绍如何使用PHP实现一个简单的爬虫，以获取网页源码和内容解析。一、获取网页源码在开始之前，我们应该先了解一下HTTP协议和HTML的基本结构。HTTP是HyperText

PHP中的单点登录（SSO）鉴权方法解析Aug 08, 2023 am 09:21 AM

PHP中的单点登录（SSO）鉴权方法解析引言：随着互联网的发展，用户通常要同时访问多个网站进行各种操作。为了提高用户体验，单点登录（SingleSign-On，简称SSO）应运而生。本文将探讨PHP中的SSO鉴权方法，并提供相应的代码示例。一、什么是单点登录（SSO）？单点登录（SSO）是一种集中化认证的方法，在多个应用系统中，用户只需要登录一次，就能访问

See all articles