>  기사  >  웹 프론트엔드  >  코드를 통해 HTML의 이스케이프 문자를 식별하는 방법

코드를 통해 HTML의 이스케이프 문자를 식별하는 방법

php中世界最好的语言
php中世界最好的语言원래의
2018-02-09 10:05:592147검색

이번에는 코드를 통해 HTML의 이스케이프 문자를 식별하는 방법을 보여 드리겠습니다. 코드를 통해 HTML 이스케이프 문자를 식별할 때 주의 사항은 무엇입니까?

가끔 데이터에서 '와 같은 문자를 볼 수 있습니다. 특징은 다음과 같습니다.
중간 숫자 문자열인 으로 시작하고 문자열인 &로 끝납니다. 중간에는;
예를 들어 가장 일반적인  또는 이에 상응하는 
브라우저가 이러한
이스케이프 문자를 발견하면 다시 이스케이프되지만 코드를 통해 이를 식별하는 방법은 무엇입니까? org.apache.commons.lang.StringEscapeUtils.unescapeHtml이 좋은 설명을 제공합니다위의 첫 번째 경우를 만날 때 가운데는 숫자이며, 숫자(유니코드)를 문자로 직접 변환합니다.
두 번째 경우를 만날 때 가운데는 문자의 경우, 매핑 테이블만 조회하면 됩니다. 매핑 테이블에서 문자에 해당하는 숫자를 찾아 char로 변환하면 됩니다. HTML40이 어떻게 정의되어 있는지 보면 한 눈에 알 수 있습니다.
ISO8859_1_ARRAY

static { 
HTML40 = new Entities(); 
fillWithHtml40Entities(HTML40); 
} 
static void fillWithHtml40Entities(Entities entities) { 
entities.addEntities(BASIC_ARRAY); 
entities.addEntities(ISO8859_1_ARRAY); 
entities.addEntities(HTML40_ARRAY); 
}


HTML40_ARRAY

private static final String[][] BASIC_ARRAY = {{"quot", "34"}, // " - double-quote 
{"amp", "38"}, // & - ampersand 
{"lt", "60"}, // < - less-than 
{"gt", "62"}, // > - greater-than 
};


추가로 확장

앞에서 볼 수 있듯이 이스케이프 문자 중간에 있는 숫자는 유니코드이므로 이 전송 문자는 부담 없이 구성할 수 있으며 다음에만 국한되지 않습니다. 예를 들어 위의 정의에서 유니코드는 20013이고 전송 문자 '中'를 구성하면 브라우저에서 렌더링된 후 다시 中으로 변경됩니다. 전송이 불편하다면 문자를 표시하세요.
특수 문자

시나리오에 적용할 수 있습니다


이 사례를 읽으신 후 방법을 익히셨을 것이라 믿습니다. 더 흥미로운 정보를 보려면 PHP의 다른 관련 기사를 주목하세요. 중국사이트!

관련 읽기:

텍스트 영역의 텍스트 영역 너비와 높이를 자동으로 조정하는 방법

html 하이퍼링크 a의 클릭 이벤트 후 href
가 가리키는 주소로 이동합니다.

위 내용은 코드를 통해 HTML의 이스케이프 문자를 식별하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.