>  기사  >  웹 프론트엔드  >  HTML 엔터티 및 웹 페이지 코딩

HTML 엔터티 및 웹 페이지 코딩

巴扎黑
巴扎黑원래의
2017-04-05 11:46:022154검색

한자는 HTML 엔터티(10진수 표현의 유니코드 인코딩)로 변환됩니다. 이에 대한 장점은 웹 페이지의 인코딩에 관계없이 한자가 문자 깨짐 없이 정상적으로 표시될 수 있다는 것입니다. 다른 문자 집합.

PHP에서는 mbstring의 mb_convert_encoding 함수를 사용하여 정방향 및 역방향 변환을 수행할 수 있습니다.
예:

mb_convert_encoding("안녕하세요", "HTML-ENTITIES", "gb2312") //출력: 你好
mb_convert_encoding("你好", "gb2312", "HTML-ENTITIES") //출력: 안녕하세요

전체 페이지를 변환해야 하는 경우 PHP 파일의 헤드에 다음 세 줄의 코드만 추가하면 됩니다.
mb_internal_encoding("gb2312"); // gb2312는 귀하의 웹사이트의 원본 인코딩입니다
mb_http_output("HTML-ENTITIES");
ob_start('mb_output_handler');

Asp 버전 다음 기능을 사용하여 이 변환을 수행할 수 있습니다.

함수 htmlentities(str)
i = 1에서 Len(str)
​​​​문자 = mid(str, i, 1)
AscW(char) > 0이면
               htmlentities = htmlentities & "" & Ascw(char) & ";"
         그 밖에
                htmlentities = htmlentities & "" & (65536 + ascW(char)) & ";"
다음과 같은 경우 종료
다음
종료 기능

JS 버전

함수 htmlentities(str)
{
      var r = "";
for( i=0; i           {
             임시 = str.charCodeAt(i);
           r += ""+temp+";";
}
       
// 정규식을 사용하여 문제를 해결할 수도 있습니다
// r = str.replace(/[dD]/g, function($0) { return "" + $0.charCodeAt(0) + ";"; });
r을 돌려주세요;
}

asp.net(c#) 버전
개인 문자열 GetHtmlEntities(문자열 str)
{
​ ​ 문자열 r = 문자열.Empty;
for (int i = 0; i < str.Length; i++)
          {
             r += ""+Char.ConvertToUtf32(str,i)+";";
}
        r을 반환합니다.
}

관련 문서: 웹 페이지에서 일반적으로 사용되는 HTML 문자 엔터티

위 내용은 HTML 엔터티 및 웹 페이지 코딩의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.