이번에는 코드를 통해 HTML의 이스케이프 문자를 식별하는 방법을 보여 드리겠습니다. 코드를 통해 HTML 이스케이프 문자를 식별할 때 주의 사항은 무엇입니까?
가끔 데이터에서 '와 같은 문자를 볼 수 있습니다. 특징은 다음과 같습니다.
중간 숫자 문자열인 으로 시작하고 문자열인 &로 끝납니다. 중간에는;
예를 들어 가장 일반적인 또는 이에 상응하는
브라우저가 이러한
이스케이프 문자를 발견하면 다시 이스케이프되지만 코드를 통해 이를 식별하는 방법은 무엇입니까? org.apache.commons.lang.StringEscapeUtils.unescapeHtml이 좋은 설명을 제공합니다위의 첫 번째 경우를 만날 때 가운데는 숫자이며, 숫자(유니코드)를 문자로 직접 변환합니다.
두 번째 경우를 만날 때 가운데는 문자의 경우, 매핑 테이블만 조회하면 됩니다. 매핑 테이블에서 문자에 해당하는 숫자를 찾아 char로 변환하면 됩니다. HTML40이 어떻게 정의되어 있는지 보면 한 눈에 알 수 있습니다.
ISO8859_1_ARRAY
static { HTML40 = new Entities(); fillWithHtml40Entities(HTML40); } static void fillWithHtml40Entities(Entities entities) { entities.addEntities(BASIC_ARRAY); entities.addEntities(ISO8859_1_ARRAY); entities.addEntities(HTML40_ARRAY); }
HTML40_ARRAY
private static final String[][] BASIC_ARRAY = {{"quot", "34"}, // " - double-quote {"amp", "38"}, // & - ampersand {"lt", "60"}, // < - less-than {"gt", "62"}, // > - greater-than };
추가로 확장
앞에서 볼 수 있듯이 이스케이프 문자 중간에 있는 숫자는 유니코드이므로 이 전송 문자는 부담 없이 구성할 수 있으며 다음에만 국한되지 않습니다. 예를 들어 위의 정의에서 유니코드는 20013이고 전송 문자 '中'를 구성하면 브라우저에서 렌더링된 후 다시 中으로 변경됩니다. 전송이 불편하다면 문자를 표시하세요.
특수 문자
이 사례를 읽으신 후 방법을 익히셨을 것이라 믿습니다. 더 흥미로운 정보를 보려면 PHP의 다른 관련 기사를 주목하세요. 중국사이트!
관련 읽기:
html 하이퍼링크 a의 클릭 이벤트 후 href
가 가리키는 주소로 이동합니다.
위 내용은 코드를 통해 HTML의 이스케이프 문자를 식별하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!