가끔 데이터에 ' 등의 문자가 나오는 것을 볼 수 있습니다. 그 특징은 다음과 같습니다
으로 시작하고 중간에 숫자가 나열되어 있습니다.
&로 시작하고 중간에
로 끝나는 문자열(예: 가장 일반적인 >
) 문자를 다시 이스케이프 처리하지만 코드를 어떻게 전달합니까? org.apache.commons.lang.StringEscapeUtils.unescapeHtml이 좋은 설명을 제공합니다
위의 첫 번째 상황에 직면하면 가운데가 숫자이고 숫자(유니코드)를 문자로 직접 변환합니다
두 번째 경우 , 중간에 문자가 있습니다. 매핑 테이블에서 해당 문자에 해당하는 숫자를 찾아 char로 변환해 보면 알 수 있습니다.
HTML40이 어떻게 정의하는지 살펴보세요
static {
HTML40 = new Entities();
fillWithHtml40Entities(HTML40);
}
static void fillWithHtml40Entities(Entities 엔터티) {
entities.addEntities(BASIC_ARRAY); 엔터티.addEntities(ISO8859_1_ARRAY);
entities.addEntities( HTML40_ARRAY);
}
BASIC_ARRAY, ISO8859_1_ARRAY 및 HTML40_ARRAY가 각각
BASIC_ARRAY
private static final String[][] BASIC_ARRAY = {{"quot", "34"}, // " - 큰따옴표
{"amp", "38"}, // & - 앰퍼샌드
{"lt", "60"}, // < - 미만
{"gt", "62"}, // > - 초과
ISO8859_1_ARRAY