>백엔드 개발 >PHP 튜토리얼 >HTML-ENTITIES 인코딩

HTML-ENTITIES 인코딩

WBOY
WBOY원래의
2016-08-08 09:28:211054검색

fabpot/goutte(https://github.com/FriendsOfPHP/Goutte)를 사용하여 웹페이지를 크롤링할 때 대상 페이지의 인코딩(gb2312...)에 관계없이 최종 결과는 유니코드라는 것을 발견했습니다.
조사 결과 Symfony의 크롤러가 html-entities 인코딩을 호출하는 것으로 나타났습니다.

mb_convert_encoding($content, 'HTML-ENTITIES', $charset);

그럼 기초지식은 위키피디아에서 대중화되죠. . . html 엔터티는 유니코드(http://en.wikipedia.org/wiki/Character_encodings_in_HTML)를 사용하여 인코딩됩니다.

참조

HTML의 숫자 참조는 범용 문자 세트/유니코드 코드 포인트로 문자를 참조합니다


이 내용은 문서화되어 있습니다.

위 내용은 HTML-ENTITIES 코딩의 측면을 포함하여 소개되었으며, PHP 튜토리얼에 관심이 있는 친구들에게 도움이 되기를 바랍니다.

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.