ホームページ >バックエンド開発 >PHPチュートリアル >HTML-ENTITIES エンコーディング
fabpot/goutte (https://github.com/FriendsOfPHP/Goutte) を使用して Web ページをクロールすると、ターゲット ページのエンコーディング (gb2312...) に関係なく、最終結果は Unicode であることがわかりました。
調査の結果、Symfony のクローラーは html-entities エンコーディングを呼び出していることがわかりました。
mb_convert_encoding($content, 'HTML-ENTITIES', $charset);
参照
HTML における数値文字参照は、ユニバーサル文字セット/Unicode コード ポイントによる文字を参照します
上記では、コンテンツの側面も含めて HTML-ENTITIES コーディングを紹介しています。PHP チュートリアルに興味のある友人に役立つことを願っています。