Java의 기본 문자 집합 수수께끼
Java에서는 플랫폼에서 사용하는 기본 문자 집합을 검색하는 데 불일치가 있는 것으로 보입니다. 이러한 불일치는 두 개의 고유한 시스템 속성 집합을 사용하고 Java 버전 간의 불일치로 인해 발생합니다.
시스템 속성
Java는 시스템에 따라 두 개의 기본 문자 집합을 유지합니다. 속성:
Java 버전 불일치
Java 5에서는 Charset.defaultCharset() 메소드는 런타임 중에 재정의될 수 있는 시스템 속성 file.encoding을 기반으로 캐시된 문자 집합을 반환합니다. 그러나 I/O 클래스에서 사용되는 기본 문자 집합은 영향을 받지 않습니다.
반대로 Java 6에서는 Charset.defaultCharset()가 인코딩을 올바르게 반영하는 기본 문자 집합의 캐시된 값을 사용하는 변경 사항을 도입했습니다. I/O 클래스에서 사용됩니다.
Java 5의 결과
질문에 제공된 예제 코드를 기반으로 Java 5에서 다음 결과가 관찰됩니다.
Default Charset=ISO-8859-1 file.encoding=Latin-1 Default Charset=UTF-8 Default Charset in Use=ISO8859_1
여기서 Charset.defaultCharset()는 캐시된 값으로 인해 초기에 "ISO-8859-1"을 반환합니다. file.encoding을 "Latin-1"로 설정해도 이 캐시된 값은 업데이트되지 않습니다. 결과적으로 Charset.defaultCharset()는 계속해서 "UTF-8"을 반환하는 반면 OutputStreamWriter는 여전히 "ISO8859_1"을 기본 인코딩으로 사용합니다.
버그 또는 기능?
이 불일치는 Java 5의 버그 또는 의도적인 디자인 선택으로 간주됩니다. Java 6 및 후속 버전에서는 기본 문자 집합을 올바르게 동기화하고 캐싱하여 문제가 해결되어 Charset.defaultCharset()과 I/O 클래스.
권장 사항
Java 5의 불일치에도 불구하고 구현에 따라 다르므로 Charset.defaultCharset()에 의존하지 않는 것이 좋습니다. 자연. 대신 텍스트 데이터 작업 시 명시적인 문자 집합 선언을 사용하세요.
위 내용은 Java 5와 이후 버전 간 기본 문자 집합 처리의 차이점은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!