PHP正确解析UTF-8字符串技巧应用_php基础-php手册-PHP中文网

首页

php教程

php手册

PHP正确解析UTF-8字符串技巧应用_php基础

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 16, 2016 am 09:00 AM

utf-8字符串解析

在《学习PHP&MYSQL之——字符编码篇（一）》中介绍了Unicode与UTF-8的转换关系，总结了一个UTF-8的编码规则，根据这个编码规则，写一个UTF-8编码的解析程序，以下是PHP的实现：

复制代码代码如下:

/* 
程序功能，$str是中英文混合的UTF-8编码字符串， 
将此字符串根据UTF-8的编码规则正确的解码并显示。 
*/ 


$str = '今天非常Happy，所有决定去KFC吃可乐鸡翅!!!'; 

/* 
$str 是待截取的字符串 
$len 是截取的字符数 
*/ 
function utf8sub($str,$len) { 
if($len return ''; 
} 

$offset = 0; // 截取高位字节时的偏移量 
$chars = 0; // 截取到的字符数 
$res = ''; // 存放截取的结果字符串 

while($chars // 先取字符串的第一个字节 
// 将它转为十进制 
// 再转为二进制 
$high = ord(substr($str,$offset,1)); 

// echo '$high='. $high .'
'; 

if($high == null ){ // 如果取出高位为null，证明已经取到末尾，直接break 
break; 
} 
if(($high>>2) === 0x3F){ // 将高位右移2位，和二进制111111比较，相同则取6个字节 
// 截取2个字节 
$count = 6; 
}else if(($high>>3) === 0x1F){ // 将高位右移2位，和二进制11111比较，相同则取5个字节 
// 截取3个字节 
$count = 5; 
}else if(($high>>4) === 0xF){ // 将高位右移2位，和二进制1111比较，相同则取4个字节 

// 截取4个字节 
$count = 4; 
}else if(($high>>5) === 0x7){ // 将高位右移2位，和二进制111比较，相同则取3个字节 

// 截取5个字节 
$count = 3; 
}else if(($high>>6) === 0x3){ // 将高位右移2位，和二进制11比较，相同则取2个字节 
// 截取6个字节 
$count = 2; 
}else if(($high>>7) === 0x0){ // 将高位右移2位，和二进制0比较，相同则取1个字节 
$count = 1; 
} 
// echo '$count='.$count.'
'; 

$res .= substr($str,$offset,$count); // 取出一个字符与$res字符串连接 
$chars += 1; // 截取到的字符数+1 
$offset += $count; // 截取高位偏移量向后移$count字节 
} 
return $res; 
} 

echo utf8sub($str,100);

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合，这些列表在安全评估过程中经常使用，都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表，帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上，他就可以访问到所需的每种类型的列表。

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序，非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具，帮助Web开发人员更好地理解保护Web应用程序的过程，并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞，难度各不相同。请注意，该软件中