搜尋
首頁php教程php手册PHP解码unicode编码中文字符代码示例,

PHP解码unicode编码中文字符代码示例,

Jun 13, 2016 am 09:27 AM
phpunicode中文程式碼字元範例編碼解碼

PHP解码unicode编码中文字符代码示例,

在抓取某网站数据,结果在数据包中发现了一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......", 这其实是中文被unicode编码后了的数据,想解码出中文来。

解决方案:

方案A(稳定版+推荐):

<span>function</span> replace_unicode_escape_sequence(<span>$match</span><span>) {
</span><span>return</span> mb_convert_encoding(<span>pack</span>('H*', <span>$match</span>[1]), 'UTF-8', 'UCS-2BE'<span>);
}
</span><span>$name</span> = '\u65b0\u6d6a\u5fae\u535a'<span>;
</span><span>$str</span> = <span>preg_replace_callback</span>('/\\\\u([0-9a-f]{4})/i', 'replace_unicode_escape_sequence', <span>$name</span><span>);
</span><span>echo</span> <span>$str</span>; <span>//</span><span>输出: 新浪微博
// www.jbxue.com 脚本学堂
//咱将上述方案A给封装起来~~~(方案A稳定版+升级+推荐)</span>
<span>class</span><span> Helper_Tool
{
</span><span>static</span> <span>function</span> unicodeDecode(<span>$data</span><span>)
{ 
</span><span>function</span> replace_unicode_escape_sequence(<span>$match</span><span>) {
</span><span>return</span> mb_convert_encoding(<span>pack</span>('H*', <span>$match</span>[1]), 'UTF-8', 'UCS-2BE'<span>);
} 

</span><span>$rs</span> = <span>preg_replace_callback</span>('/\\\\u([0-9a-f]{4})/i', 'replace_unicode_escape_sequence', <span>$data</span><span>);

</span><span>return</span> <span>$rs</span><span>;
} 
}
</span><span>//</span><span>调用</span>
<span>$name</span> = '\u65b0\u6d6a\u5fae\u535a'<span>;
</span><span>$data</span> = Helper_Tool::unicodeDecode(<span>$name</span>); <span>//</span><span>输出新浪微博</span>

小贴士:多翻翻国外的php教程,很有帮助哦。


方案B(次推荐):

<?<span>php
</span><span>function</span> unicodeDecode(<span>$name</span><span>){
</span><span>$json</span> = '{"str":"'.<span>$name</span>.'"}'<span>;
</span><span>$arr</span> = json_decode(<span>$json</span>,<span>true</span><span>);
</span><span>if</span>(<span>empty</span>(<span>$arr</span>)) <span>return</span> ''<span>; 
</span><span>return</span> <span>$arr</span>['str'<span>];
} // www.jbxue.com
</span><span>$name</span> = '\u65b0\u6d6a\u5fae\u535a'<span>;
</span><span>echo</span> unicodeDecode(<span>$name</span>); <span>//</span><span>输出: 新浪微博 </span>

对于方案B, 注意事项, 在好友 XAR (猛戳XAR博客) 的技术支持下,总结出要处理的字符串(即传递给函数unicodeDecode的参数$name的内容中一定不能包含单引号,否则就会导致解析失败, 所以有必要的话可以借助 str_replace()函数将非法字符格式化为合格字符)

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。