cari
Rumahpembangunan bahagian belakangGolangBagaimanakah Saya Boleh Membaca Fail Teks UTF-16 dengan Betul dalam Go, Mengendalikan Pengekodan BOM dan Bukan BOM?

How Can I Correctly Read UTF-16 Text Files in Go, Handling Both BOM and Non-BOM Encodings?

Membaca Fail Teks UTF-16 sebagai Rentetan dalam Go

Apabila membaca fail teks UTF-16 dalam Go, anda mungkin menghadapi masalah dengan bait yang ditafsirkan sebagai ASCII. Ini timbul kerana fungsi bufio.NewReader standard tidak mengendalikan unicode dengan betul.

Penyelesaian

UTF-16 dengan BOM

Versi terkini "golang.org/x /text/encoding/unicode" memperkenalkan unicode.BOMOverride, yang secara automatik mengesan dan mentafsir BOM untuk menyahkod UTF-16 dengan betul. Berikut ialah contoh menggunakan ReadFileUTF16():

func ReadFileUTF16(filename string) ([]byte, error) {
    raw, err := ioutil.ReadFile(filename)
    if err != nil {
        return nil, err
    }
    win16be := unicode.UTF16(unicode.BigEndian, unicode.IgnoreBOM)
    utf16bom := unicode.BOMOverride(win16be.NewDecoder())
    unicodeReader := transform.NewReader(bytes.NewReader(raw), utf16bom)
    decoded, err := ioutil.ReadAll(unicodeReader)
    return decoded, err
}

Fungsi ini akan menyahkod fail UTF-16 dengan BOM.

UTF-16 tanpa BOM

Jika fail anda melakukannya tidak mengandungi BOM, anda boleh menggunakan kod berikut:

func ReadFileUTF16WithoutBOM(filename string) ([]byte, error) {
    f, err := os.Open(filename)
    if err != nil {
        return nil, err
    }
    r := bufio.NewReader(f)

    // Read past the BOM, if any.
    var b, e = r.Peek(2)
    if (b[0] == 0xFF && b[1] == 0xFE) || (b[0] == 0xFE && b[1] == 0xFF) {
        r.Discard(2)
    }

    // Read the rest of the file.
    decoded, err := ioutil.ReadAll(r)
    return decoded, err
}

Fungsi ini akan melangkau mana-mana BOM dan baca fail sebagai UTF-16.

Kesimpulan

Dengan menggunakan ReadFileUTF16() atau ReadFileUTF16WithoutBOM(), anda boleh mengendalikan kedua-dua fail teks BOM dan bukan BOM UTF-16 dalam Go, memastikan penyahkodan dan perwakilan data anda dengan tepat.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membaca Fail Teks UTF-16 dengan Betul dalam Go, Mengendalikan Pengekodan BOM dan Bukan BOM?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Belajar pergi pengekodan/penyahkodan binari: Bekerja dengan pakej 'pengekodan/binari'Belajar pergi pengekodan/penyahkodan binari: Bekerja dengan pakej 'pengekodan/binari'May 08, 2025 am 12:13 AM

Pergi menggunakan pakej "pengekodan/binari" untuk pengekodan dan penyahkodan binari. 1) Pakej ini menyediakan binary.write dan binari. Baca fungsi untuk menulis dan membaca data. 2) Beri perhatian untuk memilih Endian yang betul (seperti Bigendian atau Littleendian). 3) Penjajaran data dan pengendalian ralat juga penting untuk memastikan ketepatan dan prestasi data.

Pergi: manipulasi slice byte dengan pakej 'bait' standardPergi: manipulasi slice byte dengan pakej 'bait' standardMay 08, 2025 am 12:09 AM

"Bytes" PakejingoOfferseficientFunctionsFormAnipulatingBytesLices.1) usebytes.joinforconcatenatingslices, 2) bytes.bufferforincrementalwriting, 3) bytes.indexorbytes.indexbyteforsearching, 4)

Pergi pengekodan/pakej binari: mengoptimumkan prestasi untuk operasi binariPergi pengekodan/pakej binari: mengoptimumkan prestasi untuk operasi binariMay 08, 2025 am 12:06 AM

Theencoding/BinaryPackageingoisfecefectiveFectimizingBinaryOperationsduetoitssupportforendiannessandefficientdatahandling.toenhancePreforance: 1) usebinary.nativiaryendianfornativeendiannesstoavoidbyteswapping.2) Batchreadandwriteoperationsoperationstoreducei/ooover

Pakej Bytes GO: Rujukan dan Petua PendekPakej Bytes GO: Rujukan dan Petua PendekMay 08, 2025 am 12:05 AM

Pakej Bytes Go digunakan terutamanya untuk memproses irisan byte dengan cekap. 1) Menggunakan bait.Buffer boleh melakukan splicing rentetan dengan cekap untuk mengelakkan peruntukan memori yang tidak perlu. 2) Fungsi bait. Digunakan untuk membandingkan irisan byte dengan cepat. 3) Fungsi bytes.index, bytes.split dan bytes.ReplaceAll boleh digunakan untuk mencari dan memanipulasi kepingan byte, tetapi isu -isu prestasi perlu diberi perhatian.

Pakej Pergi Bytes: Contoh Praktikal untuk Manipulasi Slice BytePakej Pergi Bytes: Contoh Praktikal untuk Manipulasi Slice ByteMay 08, 2025 am 12:01 AM

Pakej byte menyediakan pelbagai fungsi untuk memproses irisan byte dengan cekap. 1) Gunakan bytes.Contains untuk memeriksa urutan byte. 2) Gunakan bytes.split untuk memecah irisan byte. 3) Gantikan urutan byte bytes.replace. 4) Gunakan bytes.join untuk menyambungkan kepingan byte berganda. 5) Gunakan bytes.buffer untuk membina data. 6) gabungan bytes.map untuk pemprosesan ralat dan pengesahan data.

Pergi pengekodan/penyahkodan binari: panduan praktikal dengan contohPergi pengekodan/penyahkodan binari: panduan praktikal dengan contohMay 07, 2025 pm 05:37 PM

Pakej Pengekodan/Perduaan Go adalah alat untuk memproses data binari. 1) Ia menyokong perintah byte endian kecil dan besar-endian dan boleh digunakan dalam protokol rangkaian dan format fail. 2) Pengekodan dan penyahkodan struktur kompleks boleh dikendalikan melalui fungsi membaca dan menulis. 3) Perhatikan konsistensi pesanan byte dan jenis data apabila menggunakannya, terutamanya apabila data dihantar antara sistem yang berbeza. Pakej ini sesuai untuk pemprosesan data binari yang cekap, tetapi memerlukan pengurusan yang teliti dari irisan dan panjang byte.

Pakej 'Bytes': Bandingkan, sertai, berpecah & banyak lagiPakej 'Bytes': Bandingkan, sertai, berpecah & banyak lagiMay 07, 2025 pm 05:29 PM

"Bytes" PackageingoisessentialBecauseItoffiSficientoperationsOnbyteslices, CrucialForbinaryDatahandling, TextProcessing, andnetworkCommunications.BytesLicesaremutable, membolehkanForperformance-Enhancing-placemodifications, MakeTypackage

Pakej GO Strings: Fungsi penting yang perlu anda ketahuiPakej GO Strings: Fungsi penting yang perlu anda ketahuiMay 07, 2025 pm 04:57 PM

Go'sstringspackageCludeSessessSentialfunctionsLikeContains, trimspace, split, andReplaceAll.1) containseficientlyChorSforsubstrings.2) trimspaceremovesWhiteSpaceSetoensureSriteAdtegrity.3) SplitParstructStrikeCRIKSv

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

SecLists

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

MinGW - GNU Minimalis untuk Windows

MinGW - GNU Minimalis untuk Windows

Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.