Gunakan Node.js untuk menangani isu pengekodan kod bahagian hadapan files

Rumah

hujung hadapan web

tutorial js

Gunakan Node.js untuk menangani isu pengekodan kod bahagian hadapan files_node.js

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 16, 2016 pm 03:15 PM

javascriptnodenode.jspengekodan

Apabila menggunakan NodeJS untuk menulis alat bahagian hadapan, fail teks yang paling biasa digunakan ialah fail teks, jadi isu pengekodan fail turut terlibat. Pengekodan teks yang biasa kami gunakan ialah UTF8 dan GBK, dan fail UTF8 juga mungkin mengandungi BOM. Apabila membaca fail teks dengan pengekodan yang berbeza, kandungan fail perlu ditukar kepada rentetan berkod UTF8 yang digunakan oleh JS sebelum ia boleh diproses secara normal.

Penyingkiran BOM
BOM digunakan untuk menandakan fail teks menggunakan pengekodan Unicode, yang merupakan aksara Unicode ("uFEFF") yang terletak di pengepala fail teks. Di bawah pengekodan Unicode yang berbeza, bait binari yang sepadan dengan aksara BOM adalah seperti berikut:

  Bytes   Encoding
----------------------------
  FE FF    UTF16BE
  FF FE    UTF16LE
  EF BB BF  UTF8

Oleh itu, kami boleh menentukan sama ada fail itu mengandungi BOM dan pengekodan Unikod yang hendak digunakan berdasarkan jumlah beberapa bait pertama fail teks yang sama. Walau bagaimanapun, walaupun aksara BOM memainkan peranan dalam menandakan pengekodan fail, ia bukan sebahagian daripada kandungan fail Jika BOM tidak dialih keluar semasa membaca fail teks, akan ada masalah dalam senario penggunaan tertentu. Sebagai contoh, selepas kami menggabungkan beberapa fail JS ke dalam satu fail, jika fail tersebut mengandungi aksara BOM, ia akan menyebabkan ralat sintaks JS penyemak imbas. Oleh itu, apabila menggunakan NodeJS untuk membaca fail teks, anda biasanya perlu mengalih keluar BOM. Sebagai contoh, kod berikut melaksanakan fungsi mengenal pasti dan mengalih keluar BOM UTF8.

function readText(pathname) {
  var bin = fs.readFileSync(pathname);

  if (bin[0] === 0xEF && bin[1] === 0xBB && bin[2] === 0xBF) {
    bin = bin.slice(3);
  }

  return bin.toString('utf-8');
}

GBK kepada UTF8
NodeJS menyokong penentuan pengekodan teks apabila membaca fail teks atau apabila menukar Penimbal kepada rentetan, tetapi malangnya, pengekodan GBK tidak berada dalam skop sokongan NodeJS sendiri. Oleh itu, kami biasanya menggunakan pakej pihak ketiga iconv-lite untuk menukar pengekodan. Selepas memuat turun pakej menggunakan NPM, kita boleh menulis fungsi untuk membaca fail teks GBK seperti berikut.

var iconv = require('iconv-lite');

function readGBKText(pathname) {
  var bin = fs.readFileSync(pathname);

  return iconv.decode(bin, 'gbk');
}

Pengekodan bait tunggal
Kadangkala, kami tidak dapat meramalkan pengekodan fail yang perlu kami baca gunakan, jadi kami tidak dapat menentukan pengekodan yang betul. Sebagai contoh, beberapa fail CSS yang perlu kami proses dikodkan dalam GBK dan beberapa dalam UTF8. Walaupun adalah mungkin untuk meneka pengekodan teks berdasarkan kandungan bait fail pada tahap tertentu, apa yang saya akan perkenalkan di sini adalah teknik yang agak terhad, tetapi lebih mudah.

Pertama sekali, kami tahu bahawa jika fail teks hanya mengandungi aksara Inggeris, seperti Hello World, maka tidak akan ada masalah membaca fail menggunakan pengekodan GBK atau pengekodan UTF8. Ini kerana di bawah pengekodan ini, aksara dalam julat ASCII0~128 menggunakan pengekodan bait tunggal yang sama.

Sebaliknya, walaupun terdapat aksara Cina dan aksara lain dalam fail teks, jika aksara yang perlu kita proses hanya dalam julat ASCII0~128, seperti kod JS selain daripada ulasan dan rentetan, kita boleh gunakan bait tunggal secara seragam untuk membaca fail, tidak perlu mengambil kira sama ada pengekodan sebenar fail adalah GBK atau UTF8. Contoh berikut menggambarkan pendekatan ini.

1. kandungan fail sumber pengekodan GBK:

  var foo = '中文';

2. Bait sepadan:

  76 61 72 20 66 6F 6F 20 3D 20 27 D6 D0 CE C4 27 3B

3. Kandungan yang diperoleh selepas membaca menggunakan pengekodan bait tunggal:

  var foo = '{乱码}{乱码}{乱码}{乱码}';

4. Kandungan pengganti:

  var bar = '{乱码}{乱码}{乱码}{乱码}';

5. Bait yang sepadan selepas disimpan menggunakan pengekodan bait tunggal:

  76 61 72 20 62 61 72 20 3D 20 27 D6 D0 CE C4 27 3B

6. Gunakan pengekodan GBK untuk membaca dan mendapatkan kandungan:

  var bar = '中文';

Caranya di sini ialah tidak kira apa aksara yang bercelaru satu bait yang lebih besar daripada 0xEF dihuraikan di bawah pengekodan bait tunggal, apabila aksara yang bercelaru ini disimpan menggunakan pengekodan bait tunggal yang sama, bait yang sepadan di belakangnya kekal tidak berubah.

NodeJS disertakan dengan pengekodan binari yang boleh digunakan untuk melaksanakan kaedah ini, jadi dalam contoh berikut, kami menggunakan pengekodan ini untuk menunjukkan cara menulis kod yang sepadan dengan contoh di atas.

function replace(pathname) {
  var str = fs.readFileSync(pathname, 'binary');
  str = str.replace('foo', 'bar');
  fs.writeFileSync(pathname, str, 'binary');
}

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Rangka Kerja JavaScript: Menguasai Pembangunan Web ModenMay 02, 2025 am 12:04 AM

Kuasa rangka kerja JavaScript terletak pada pembangunan yang memudahkan, meningkatkan pengalaman pengguna dan prestasi aplikasi. Apabila memilih rangka kerja, pertimbangkan: 1.

Hubungan antara JavaScript, C, dan penyemak imbasMay 01, 2025 am 12:06 AM

Pengenalan Saya tahu anda mungkin merasa pelik, apa sebenarnya yang perlu dilakukan oleh JavaScript, C dan penyemak imbas? Mereka seolah -olah tidak berkaitan, tetapi sebenarnya, mereka memainkan peranan yang sangat penting dalam pembangunan web moden. Hari ini kita akan membincangkan hubungan rapat antara ketiga -tiga ini. Melalui artikel ini, anda akan mempelajari bagaimana JavaScript berjalan dalam penyemak imbas, peranan C dalam enjin pelayar, dan bagaimana mereka bekerjasama untuk memacu rendering dan interaksi laman web. Kita semua tahu hubungan antara JavaScript dan penyemak imbas. JavaScript adalah bahasa utama pembangunan front-end. Ia berjalan secara langsung di penyemak imbas, menjadikan laman web jelas dan menarik. Adakah anda pernah tertanya -tanya mengapa Javascr

Aliran node.js dengan typescriptApr 30, 2025 am 08:22 AM

Node.js cemerlang pada I/O yang cekap, sebahagian besarnya terima kasih kepada aliran. Aliran memproses data secara berperingkat, mengelakkan beban memori-ideal untuk fail besar, tugas rangkaian, dan aplikasi masa nyata. Menggabungkan sungai dengan keselamatan jenis typescript mencipta powe

Python vs JavaScript: Pertimbangan Prestasi dan KecekapanApr 30, 2025 am 12:08 AM

Perbezaan prestasi dan kecekapan antara Python dan JavaScript terutamanya dicerminkan dalam: 1) sebagai bahasa yang ditafsirkan, Python berjalan perlahan tetapi mempunyai kecekapan pembangunan yang tinggi dan sesuai untuk pembangunan prototaip pesat; 2) JavaScript adalah terhad kepada benang tunggal dalam penyemak imbas, tetapi I/O multi-threading dan asynchronous boleh digunakan untuk meningkatkan prestasi dalam node.js, dan kedua-duanya mempunyai kelebihan dalam projek sebenar.

Asal JavaScript: Meneroka Bahasa PelaksanaannyaApr 29, 2025 am 12:51 AM

JavaScript berasal pada tahun 1995 dan dicipta oleh Brandon Ike, dan menyedari bahasa itu menjadi C. 1.C Language menyediakan keupayaan pengaturcaraan prestasi tinggi dan sistem untuk JavaScript. 2. Pengurusan memori JavaScript dan pengoptimuman prestasi bergantung pada bahasa C. 3. Ciri lintas platform bahasa C membantu JavaScript berjalan dengan cekap pada sistem operasi yang berbeza.

Di sebalik tabir: Apa bahasa JavaScript?Apr 28, 2025 am 12:01 AM

JavaScript berjalan dalam penyemak imbas dan persekitaran Node.js dan bergantung pada enjin JavaScript untuk menghuraikan dan melaksanakan kod. 1) menjana pokok sintaks abstrak (AST) di peringkat parsing; 2) menukar AST ke bytecode atau kod mesin dalam peringkat penyusunan; 3) Laksanakan kod yang disusun dalam peringkat pelaksanaan.

Masa Depan Python dan JavaScript: Trend dan RamalanApr 27, 2025 am 12:21 AM

Trend masa depan Python dan JavaScript termasuk: 1. Kedua -duanya akan terus mengembangkan senario aplikasi dalam bidang masing -masing dan membuat lebih banyak penemuan dalam prestasi.

Python vs JavaScript: Persekitaran dan Alat PembangunanApr 26, 2025 am 12:09 AM

Kedua -dua pilihan Python dan JavaScript dalam persekitaran pembangunan adalah penting. 1) Persekitaran pembangunan Python termasuk Pycharm, Jupyternotebook dan Anaconda, yang sesuai untuk sains data dan prototaip cepat. 2) Persekitaran pembangunan JavaScript termasuk node.js, vscode dan webpack, yang sesuai untuk pembangunan front-end dan back-end. Memilih alat yang betul mengikut keperluan projek dapat meningkatkan kecekapan pembangunan dan kadar kejayaan projek.

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

4 minggu yang laluByDDD

Bagaimana untuk memperbaiki KB5055523 gagal dipasang di Windows 11?

3 minggu yang laluByDDD

Inzoi: Cara Memohon ke Sekolah dan Universiti

1 bulan yang laluByDDD

Bagaimana untuk memperbaiki KB5055518 gagal dipasang di Windows 10?

3 minggu yang laluByDDD

Di mana untuk mencari kunci pejabat tapak di atomfall

4 minggu yang laluByDDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.