Di Java, menentukan set aksara lalai boleh menjadi isu yang bernuansa. Salah tanggapan biasa ialah Charset.defaultCharset() menyediakan jawapan yang pasti. Walau bagaimanapun, seperti yang diketengahkan oleh soalan, kaedah ini mungkin tidak sejajar dengan set aksara lalai sebenar yang digunakan dalam keadaan tertentu.
Soalan mendedahkan bahawa Java nampaknya mengekalkan dua set berbeza bagi set aksara lalai. Yang pertama ialah charset cache yang dikembalikan oleh Charset.defaultCharset(). Yang kedua ialah charset lalai "sebenar" yang digunakan secara dalaman oleh kelas Java I/O seperti OutputStreamWriter.
Dalam Java 5, charset lalai dikembalikan oleh Charset.defaultCharset( ) tidak dicache pada permulaan JVM. Ini bermakna setiap panggilan ke kaedah cuba menentukan set charset yang sesuai berdasarkan sifat sistem "file.encoding". Jika sifat ini ditetapkan, kaedah mengembalikan set aksara yang sepadan atau lalai kepada UTF-8 jika tidak ditemui.
Masalah timbul apabila pengekodan fail ditetapkan secara eksplisit pada runtime, seperti yang ditunjukkan dalam contoh kod dalam soalan. Dengan menetapkan sifat kepada "Latin-1", pembangun berhasrat untuk mengatasi lalai sistem. Walau bagaimanapun, perubahan ini tidak menjejaskan charset cache yang digunakan oleh Charset.defaultCharset(). Akibatnya, panggilan berikutnya kepada kaedah ini mengembalikan UTF-8 yang dicache, yang tidak konsisten dengan charset lalai "sebenar" yang digunakan oleh kelas I/O.
Di Java 6, isu ini telah ditangani. Charset cache ditetapkan pada permulaan JVM dan Charset.defaultCharset() secara konsisten mengembalikan nilai cache ini. Selain itu, kelas I/O bergantung pada Charset.defaultCharset() untuk menentukan pengekodan lalai, memastikan penjajaran antara kaedah yang berbeza untuk mendapatkan charset lalai.
Gelagat Charset.defaultCharset( ) dalam Java 5 boleh membawa kepada ketidakkonsistenan dengan set aksara lalai sebenar yang digunakan secara dalaman oleh kelas I/O. Java 6 menyelesaikan isu ini dengan menyimpan charset lalai pada permulaan JVM dan menyeragamkan penggunaannya merentas kaedah Java. Walaupun tergoda untuk bergantung pada Charset.defaultCharset(), adalah penting untuk diingat bahawa sifat ini mewakili butiran pelaksanaan tertakluk kepada perubahan antara versi Java yang berbeza.
Atas ialah kandungan terperinci Mengapa Java 5 Mempunyai Gelagat Charset Lalai Tidak Konsisten?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!