PHP解码unicode编码中文字符代码示例,
在抓取某网站数据,结果在数据包中发现了一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......", 这其实是中文被unicode编码后了的数据,想解码出中文来。
解决方案:
方案A(稳定版+推荐):
<span>function</span> replace_unicode_escape_sequence(<span>$match</span><span>) { </span><span>return</span> mb_convert_encoding(<span>pack</span>('H*', <span>$match</span>[1]), 'UTF-8', 'UCS-2BE'<span>); } </span><span>$name</span> = '\u65b0\u6d6a\u5fae\u535a'<span>; </span><span>$str</span> = <span>preg_replace_callback</span>('/\\\\u([0-9a-f]{4})/i', 'replace_unicode_escape_sequence', <span>$name</span><span>); </span><span>echo</span> <span>$str</span>; <span>//</span><span>输出: 新浪微博 // www.jbxue.com 脚本学堂 //咱将上述方案A给封装起来~~~(方案A稳定版+升级+推荐)</span> <span>class</span><span> Helper_Tool { </span><span>static</span> <span>function</span> unicodeDecode(<span>$data</span><span>) { </span><span>function</span> replace_unicode_escape_sequence(<span>$match</span><span>) { </span><span>return</span> mb_convert_encoding(<span>pack</span>('H*', <span>$match</span>[1]), 'UTF-8', 'UCS-2BE'<span>); } </span><span>$rs</span> = <span>preg_replace_callback</span>('/\\\\u([0-9a-f]{4})/i', 'replace_unicode_escape_sequence', <span>$data</span><span>); </span><span>return</span> <span>$rs</span><span>; } } </span><span>//</span><span>调用</span> <span>$name</span> = '\u65b0\u6d6a\u5fae\u535a'<span>; </span><span>$data</span> = Helper_Tool::unicodeDecode(<span>$name</span>); <span>//</span><span>输出新浪微博</span>
小贴士:多翻翻国外的php教程,很有帮助哦。
方案B(次推荐):
<?<span>php </span><span>function</span> unicodeDecode(<span>$name</span><span>){ </span><span>$json</span> = '{"str":"'.<span>$name</span>.'"}'<span>; </span><span>$arr</span> = json_decode(<span>$json</span>,<span>true</span><span>); </span><span>if</span>(<span>empty</span>(<span>$arr</span>)) <span>return</span> ''<span>; </span><span>return</span> <span>$arr</span>['str'<span>]; } // www.jbxue.com </span><span>$name</span> = '\u65b0\u6d6a\u5fae\u535a'<span>; </span><span>echo</span> unicodeDecode(<span>$name</span>); <span>//</span><span>输出: 新浪微博 </span>
对于方案B, 注意事项, 在好友 XAR (猛戳XAR博客) 的技术支持下,总结出要处理的字符串(即传递给函数unicodeDecode的参数$name的内容中一定不能包含单引号,否则就会导致解析失败, 所以有必要的话可以借助 str_replace()函数将非法字符格式化为合格字符)
陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
刺客信條陰影:貝殼謎語解決方案
3 週前ByDDD
Windows 11 KB5054979中的新功能以及如何解決更新問題
2 週前ByDDD
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

Dreamweaver Mac版
視覺化網頁開發工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。