ホームページ >バックエンド開発 >PHPチュートリアル >HTML-ENTITIES エンコーディング

HTML-ENTITIES エンコーディング

WBOY
WBOYオリジナル
2016-08-08 09:28:211040ブラウズ

fabpot/goutte (https://github.com/FriendsOfPHP/Goutte) を使用して Web ページをクロールすると、ターゲット ページのエンコーディング (gb2312...) に関係なく、最終結果は Unicode であることがわかりました。
調査の結果、Symfony のクローラーは html-entities エンコーディングを呼び出していることがわかりました。

mb_convert_encoding($content, 'HTML-ENTITIES', $charset);

では、基礎知識はWikipediaで普及しています。 。 。 html エンティティは Unicode を使用してエンコードされます (http://en.wikipedia.org/wiki/Character_encodings_in_HTML)。

参照

HTML における数値文字参照は、ユニバーサル文字セット/Unicode コード ポイントによる文字を参照します


ここに記録されています。

上記では、コンテンツの側面も含めて HTML-ENTITIES コーディングを紹介しています。PHP チュートリアルに興味のある友人に役立つことを願っています。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。