Heim >Backend-Entwicklung >PHP-Tutorial >HTML-ENTITIES-Codierung

HTML-ENTITIES-Codierung

WBOY
WBOYOriginal
2016-08-08 09:28:211054Durchsuche

Als ich fabpot/goutte (https://github.com/FriendsOfPHP/Goutte) zum Crawlen der Webseite verwendete, stellte ich fest, dass das Endergebnis unabhängig von der Codierung der Zielseite (gb2312 ...) Unicode ist.
Nach Recherchen habe ich herausgefunden, dass der Crawler von Symfony die Codierung von HTML-Entitäten aufruft.

mb_convert_encoding($content, 'HTML-ENTITIES', $charset);

Dann wird das Grundwissen auf Wikipedia populär gemacht. . . HTML-Entitäten werden mit Unicode codiert (http://en.wikipedia.org/wiki/Character_encodings_in_HTML).

Referenz

Eine numerische Zeichenreferenz in HTML verweist auf ein Zeichen anhand seines Universal Character Set/Unicode-Codepunkts


Dies ist dokumentiert.

Das Obige hat die HTML-ENTITIES-Codierung eingeführt, einschließlich einiger Aspekte davon. Ich hoffe, dass es für Freunde hilfreich sein wird, die sich für PHP-Tutorials interessieren.

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn