한자는 HTML 엔터티(10진수 표현의 유니코드 인코딩)로 변환됩니다. 이에 대한 장점은 웹 페이지의 인코딩에 관계없이 한자가 문자 깨짐 없이 정상적으로 표시될 수 있다는 것입니다. 다른 문자 집합.
PHP에서는 mbstring의 mb_convert_encoding 함수를 사용하여 정방향 및 역방향 변환을 수행할 수 있습니다.
예:
mb_convert_encoding("안녕하세요", "HTML-ENTITIES", "gb2312") //출력: 你好
mb_convert_encoding("你好", "gb2312", "HTML-ENTITIES") //출력: 안녕하세요
전체 페이지를 변환해야 하는 경우 PHP 파일의 헤드에 다음 세 줄의 코드만 추가하면 됩니다.
mb_internal_encoding("gb2312"); // gb2312는 귀하의 웹사이트의 원본 인코딩입니다
mb_http_output("HTML-ENTITIES");
ob_start('mb_output_handler');
Asp 버전 다음 기능을 사용하여 이 변환을 수행할 수 있습니다.
함수 htmlentities(str)
i = 1에서 Len(str)
문자 = mid(str, i, 1)
AscW(char) > 0이면
htmlentities = htmlentities & "" & Ascw(char) & ";"
그 밖에
htmlentities = htmlentities & "" & (65536 + ascW(char)) & ";"
다음과 같은 경우 종료
다음
종료 기능
JS 버전
함수 htmlentities(str)
{
var r = "";
for( i=0; i
임시 = str.charCodeAt(i);
r += ""+temp+";";
}
// 정규식을 사용하여 문제를 해결할 수도 있습니다
// r = str.replace(/[dD]/g, function($0) { return "" + $0.charCodeAt(0) + ";"; });
r을 돌려주세요;
}
asp.net(c#) 버전
개인 문자열 GetHtmlEntities(문자열 str)
{
문자열 r = 문자열.Empty;
for (int i = 0; i < str.Length; i++)
{
r += ""+Char.ConvertToUtf32(str,i)+";";
}
r을 반환합니다.
}
관련 문서: 웹 페이지에서 일반적으로 사용되는 HTML 문자 엔터티
위 내용은 HTML 엔터티 및 웹 페이지 코딩의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!