Rumah >Java >javaTutorial >Bagaimanakah Saya Mengekod dan Menyahkod Tatasusunan UTF-8 Byte dan Rentetan Java?
Pengekodan dan Penyahkodan Tatasusunan UTF-8 Byte dan Rentetan Java
Dalam Java, memanipulasi data teks memerlukan penukaran yang lancar antara rentetan dan tatasusunan bait dalam pelbagai pengekodan. Artikel ini meneroka cara untuk melaksanakan penukaran ini dengan cekap, memfokuskan pada pengekodan UTF-8 yang digunakan secara meluas.
Pengekodan Rentetan kepada Tatasusunan Byte
Untuk menukar rentetan Java kepada tatasusunan bait berkod UTF-8, gunakan kaedah getBytes(). Contohnya:
String str = "Hello, world!"; byte[] byteArray = str.getBytes(StandardCharsets.UTF_8);
Menyahkod Tatasusunan Byte kepada Rentetan
Untuk mendapatkan rentetan Java daripada tatasusunan bait yang diberikan, gunakan pembina String() baharu, dengan menyatakan pengekodan yang dikehendaki. Contoh:
byte[] byteArray = {(byte) 72, (byte) 101, (byte) 108, (byte) 108, (byte) 111}; String str = new String(byteArray, StandardCharsets.UTF_8);
Kepentingan Spesifikasi Pengekodan
Memilih pengekodan yang sesuai adalah penting untuk penukaran rentetan yang betul. UTF-8 ialah pengekodan serba boleh yang menyokong kebanyakan aksara yang terdapat dalam bahasa manusia. Walau bagaimanapun, untuk keperluan pengekodan lain, pilih pemalar pengekodan yang sesuai daripada kelas StandardCharsets.
Atas ialah kandungan terperinci Bagaimanakah Saya Mengekod dan Menyahkod Tatasusunan UTF-8 Byte dan Rentetan Java?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!