>  기사  >  Java  >  Java에서 Excel로 내보낸 문자가 왜곡되는 이유와 해결 방법

Java에서 Excel로 내보낸 문자가 왜곡되는 이유와 해결 방법

尚
원래의
2019-11-29 10:37:146974검색

Java에서 Excel로 내보낸 문자가 왜곡되는 이유와 해결 방법

Java를 내보내는 잘못된 방법과 올바른 방법: (권장: Java 비디오 튜토리얼)

错误方式:
response.setHeader("Content-Disposition", "inline;filename="+ new String(fileName.getBytes(),"utf-8"));
String fileName =    aicaseNodeDeptService.getFilename(request)+".xlsx";
 
response.setCharacterEncoding("UTF-8");
response.setContentType("application/ms-excel");
正确的方式:
response.setHeader("Content-Disposition",
        "inline;filename="+
                new String(fileName.getBytes("utf-8"),"iso8859-1"));

이유: httpheader에서는 해당 문자를 대상 프로그램에 전달한 후 iso8859-1로 인코딩해야 합니다. 그런 다음 반대 방법인 Strings_utf8 = newString(s_iso88591.getBytes("ISO8859-1"), "UTF-8")을 사용하여 올바른 중국어 문자 "中"을 얻습니다. 이렇게 하면 프로토콜 준수가 보장되고 중국어가 지원됩니다.

Java에서 String의 getBytes() 메서드는 운영 체제의 기본 인코딩 형식으로 바이트 배열을 가져오는 것입니다. 이는 운영 체제에 따라 반환되는 내용이 다르다는 것을 의미합니다.

String.getBytes(Stringdecode) 메서드는 다음과 같이 지정된 디코드 인코딩에서 특정 문자열의 바이트 배열 표현을 반환합니다. GBK, UTF-8, ISO8859-1 인코딩으로 한자 "中"의 바이트 배열 표현. 이때

b_gbk의 길이는 2,

b_utf8의 길이는 3,

의 길이 b_iso88591은 1입니다.

getBytes와 비교하면 new String(byte[], decode)를 통해 "中" 문자를 복원할 수 있습니다.

이 new String(byte[], decode)는 실제로 지정된 인코딩을 사용하여 byte[]로 구문 분석됩니다.

byte[] b_gbk = "中".getBytes("GBK");
byte[] b_utf8 = "中".getBytes("UTF-8");
byte[] b_iso88591 = "中".getBytes("ISO8859-1");

s_gbk, s_utf8 및 s_iso88591을 출력하면 s_gbk 및 s_utf8이 모두 "medium"이라는 것을 알 수 있지만 s_iso88591만 인식할 수 없는 문자입니다(잘못된 코드로 이해될 수 있음). 왜 -1 인코딩 이후에 ISO8859를 사용합니까? 그리고 재조합하면 '中'이라는 단어는 복원할 수 없나요? 그 이유는 매우 간단합니다. ISO8859-1 인코딩의 인코딩 테이블에는 한자가 전혀 포함되어 있지 않기 때문입니다. 물론 "中".getBytes("ISO8859)를 통해 ISO8859-1에서 올바른 "中" 문자를 얻는 것은 불가능합니다. -1"); 인코딩된 값이 이미 있으므로 newString()을 통해 복원할 수 없습니다.

따라서 String.getBytes(Stringdecode) 메소드를 통해 byte[]를 얻을 때 String이 표현하는 코드 값이 디코드 인코딩 테이블에 실제로 존재하는지 확인해야 획득된 byte[] 배열이 올바르게 복원될 수 있습니다. .

참고:

때때로 특정 특수 요구 사항(예: 내용이 iso8859-1로 인코딩되어야 하는 httpheader)에 중국어 문자를 적용하기 위해 중국어 문자를 다음과 같은 바이트 형식으로 인코딩할 수 있습니다.

String s_iso88591 = newString("中".getBytes("UTF-8"),"ISO8859-1") 이렇게 얻은 s_iso8859-1 문자열은 실제로 ISO8859-1의 세 글자인데, 이 문자들을 대상 프로그램은 반대 방법을 사용합니다. Strings_utf8 = newString(s_iso88591.getBytes("ISO8859-

Java에 대한 자세한 내용은

java 기본 튜토리얼

열을 참고하세요.

위 내용은 Java에서 Excel로 내보낸 문자가 왜곡되는 이유와 해결 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.