首頁 >後端開發 >php教程 >HTML-ENTITIES編碼

HTML-ENTITIES編碼

WBOY
WBOY原創
2016-08-08 09:28:211040瀏覽

用fabpot/goutte(https://github.com/FriendsOfPHP/Goutte)抓取網頁的時候,發現無論目標頁是什麼編碼(gb2312...),最後得到的都是unicode。
研究下發現是Symfony的crawler呼叫了html-entities編碼。

mb_convert_encoding($content, 'HTML-ENTITIES', $charset);

然後,wiki百科上普及了下基礎知識。 。 。 html-entities編碼用的是unicode (http://en.wikipedia.org/wiki/Character_encodings_in_HTML)。

引用

A numeric character reference in HTML refers to a character by its Universal Character Set/Unicode code point


特此記錄。

以上就介紹了HTML-ENTITIES編碼,包括了方面的內容,希望對PHP教程有興趣的朋友有所幫助。

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn