Rumah > Artikel > hujung hadapan web > transkod unicode nodejs
Pengalihan Kod Unikod Node.js
Pengekodan dan penyahkodan Unikod dalam Node.js menjadi semakin biasa. Kaedahnya untuk mencari jujukan Unicode adalah mudah berbanding dengan banyak bahasa pengaturcaraan biasa. JavaScript secara semula jadi menyokong rentetan Unicode kerana mekanisme pengekodan UTF-16 terbina dalamnya. Dalam artikel ini, kami akan membincangkan cara menggunakan pengekodan dan penyahkod Unicode dalam Node.js.
Pengenalan kepada Unicode
Unicode ialah pengekodan aksara yang direka untuk merangkumi semua set aksara dan memberikannya titik kod angka yang unik. Ini bermakna Unicode boleh digunakan untuk mewakili hampir semua aksara dalam mana-mana bahasa, sama ada aksara biasa atau jarang berlaku. Ia juga menyokong Emoji dan pelbagai simbol. Unicode menggunakan unit kod 16-bit atau 32-bit untuk mewakili semua aksara sebagai nombor, dipanggil titik kod.
Menggunakan Unicode dalam JavaScript
JavaScript mempunyai sokongan terbina dalam untuk Unicode. Dalam JavaScript, mekanisme pengekodan UTF-16 digunakan untuk menyimpan rentetan dan sintaks u xxxx dan u{xxxxx} dibenarkan untuk mewakili titik kod Unicode (dengan x ialah nombor perenambelasan). Sebagai contoh, berikut ialah contoh titik kod Unicode yang mewakili aksara Cina "中": u4e2d dan u{4e2d}.
const str1 = "u4e2d";
const str2 = "u{4e2d}";
console.log(str1); // Medium
console.log(str2 ); // Sederhana
Menggunakan Unicode dalam Node.js
Dalam Node.js, anda juga boleh menggunakan objek Penampan untuk mengendalikan pengekodan dan penyahkodan Unikod. Penampan boleh dianggap sebagai tatasusunan integer yang tidak ditandatangani, dengan setiap elemen mempunyai nilai antara 0 dan 255, tetapi kaedah toString boleh digunakan untuk mentafsir kandungan dengan cara yang menyahkod rentetan sebagai Unicode.
Keperluan biasa ialah menukar rentetan Unicode kepada tatasusunan bait dalam pengekodan UTF-8. Ini boleh dilakukan dengan menghantar rentetan kepada kaedah Buffer:
const str = "Node.js is cool";
const buff = Buffer.from(str, "utf-8"); 🎜>
const str = buff.toString("utf-8");
const buff = Buffer.from(str , "ucs2");
const str = buff.toString("ucs2");
Atas ialah kandungan terperinci transkod unicode nodejs. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!