cari
Rumahpembangunan bahagian belakangGolangBagaimanakah Saya Boleh Mengesan Urutan UTF-8 Byte Tidak Sah dalam Go?

How Can I Detect Invalid UTF-8 Byte Sequences in Go?

Mengesan Urutan Bait Tidak Sah dalam Go

Dalam Go, apabila menukar kepingan bait ([]bait) kepada rentetan, adalah mungkin untuk menemui urutan bait yang tidak sah yang tidak boleh diterjemahkan ke dalam Unicode. Ini timbul daripada fakta bahawa bukan semua jujukan bait mewakili aksara UTF-8 yang sah.

Untuk mengesan kejadian sedemikian, dua pendekatan tersedia:

Semakan Kesahan UTF-8:

Seperti yang disebut oleh Tim Cooper, fungsi utf8.Valid boleh digunakan untuk menguji sama ada kepingan bait mengandungi UTF-8 bait yang sah. Jika hasilnya palsu, ini menunjukkan kehadiran jujukan bait yang tidak sah.

Pertimbangan Penukaran Rentetan:

Bertentangan dengan andaian biasa, Go membenarkan penukaran bukan UTF -8 bait hirisan kepada rentetan. Walau bagaimanapun, adalah penting untuk ambil perhatian bahawa rentetan dalam Go pada asasnya ialah hirisan bait baca sahaja dan oleh itu boleh menampung bait yang tidak sah UTF-8.

Hanya dalam situasi tertentu Go secara automatik melaksanakan UTF- 8 penyahkodan:

  • Apabila melelaran pada rentetan menggunakan sintaks for i, r := range s, pembolehubah r mewakili a Titik kod Unicode (rune) dan sentiasa sah.
  • Apabila menukar daripada rentetan kepada hirisan rune (iaitu, []rune(s)), Go menyahkod keseluruhan rentetan kepada rune.

Dalam kedua-dua kes, aksara UTF-8 yang tidak sah digantikan dengan aksara gantian U FFFD. Penggantian ini mungkin tidak boleh diterima dalam semua aplikasi, jadi disyorkan untuk melakukan pengesahan UTF-8 yang jelas jika perlu.

Contoh:

Pertimbangkan program Go berikut:

package main

import (
    "fmt"
    "unicode/utf8"
)

func main() {
    a := []byte{0xff}
    s := string(a)

    // Check UTF-8 validity
    if utf8.Valid(a) {
        fmt.Println("Valid UTF-8")
    } else {
        fmt.Println("Invalid UTF-8")
    }

    // Output string
    fmt.Println(s)
}

Output:

Invalid UTF-8
�

Dalam contoh ini, hirisan bait a mengandungi jujukan bait yang tidak sah, menghasilkan mesej "UTF-8 tidak sah". Selepas itu, apabila menukarnya kepada rentetan, bait yang tidak sah diwakili oleh aksara gantian "�".

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengesan Urutan UTF-8 Byte Tidak Sah dalam Go?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Belajar manipulasi rentetan: bekerja dengan pakej 'rentetan'Belajar manipulasi rentetan: bekerja dengan pakej 'rentetan'May 09, 2025 am 12:07 AM

Pakej "Strings" Go menyediakan ciri -ciri yang kaya untuk membuat operasi rentetan cekap dan mudah. 1) Gunakan strings.contains () untuk memeriksa substrings. 2) Strings.split () boleh digunakan untuk menghuraikan data, tetapi ia harus digunakan dengan berhati -hati untuk mengelakkan masalah prestasi. 3) Strings.join () sesuai untuk rentetan pemformatan, tetapi untuk dataset kecil, gelung = lebih efisien. 4) Untuk rentetan besar, lebih cekap untuk membina rentetan menggunakan rentetan.builder.

Pergi: Manipulasi String dengan pakej 'Strings' standardPergi: Manipulasi String dengan pakej 'Strings' standardMay 09, 2025 am 12:07 AM

Go menggunakan pakej "Strings" untuk operasi rentetan. 1) Gunakan fungsi string.join untuk rentetan sambatan. 2) Gunakan Strings.Contains Fungsi untuk mencari substrings. 3) Gunakan fungsi Strings.Replace untuk menggantikan rentetan. Fungsi -fungsi ini adalah cekap dan mudah digunakan dan sesuai untuk pelbagai tugas pemprosesan rentetan.

Menguasai manipulasi slice byte dengan pakej 'bait' Go: Panduan PraktikalMenguasai manipulasi slice byte dengan pakej 'bait' Go: Panduan PraktikalMay 09, 2025 am 12:02 AM

TheBytespackageingoisessentialforefficientbytesliceManipulation, menawarkanFunctionsLikecontains, index, andReplaceForsearchingandModifingBinaryData.ItenhancesperformanceandCodereadability, MakingitavitalToolforhandlingBinaryData, NetworkProtocols, andfilePoLoCols, danFilePoLols, danFilePoLols, danFilePoLols, danFilePoLols, danFilePoLols, danFilePoLols, danFilePols, danfile, danfile, danfile, danfile, danfile, danfile, danfile

Belajar pergi pengekodan/penyahkodan binari: Bekerja dengan pakej 'pengekodan/binari'Belajar pergi pengekodan/penyahkodan binari: Bekerja dengan pakej 'pengekodan/binari'May 08, 2025 am 12:13 AM

Pergi menggunakan pakej "pengekodan/binari" untuk pengekodan dan penyahkodan binari. 1) Pakej ini menyediakan binary.write dan binari. Baca fungsi untuk menulis dan membaca data. 2) Beri perhatian untuk memilih Endian yang betul (seperti Bigendian atau Littleendian). 3) Penjajaran data dan pengendalian ralat juga penting untuk memastikan ketepatan dan prestasi data.

Pergi: manipulasi slice byte dengan pakej 'bait' standardPergi: manipulasi slice byte dengan pakej 'bait' standardMay 08, 2025 am 12:09 AM

"Bytes" PakejingoOfferseficientFunctionsFormAnipulatingBytesLices.1) usebytes.joinforconcatenatingslices, 2) bytes.bufferforincrementalwriting, 3) bytes.indexorbytes.indexbyteforsearching, 4)

Pergi pengekodan/pakej binari: mengoptimumkan prestasi untuk operasi binariPergi pengekodan/pakej binari: mengoptimumkan prestasi untuk operasi binariMay 08, 2025 am 12:06 AM

Theencoding/BinaryPackageingoisfecefectiveFectimizingBinaryOperationsduetoitssupportforendiannessandefficientdatahandling.toenhancePreforance: 1) usebinary.nativiaryendianfornativeendiannesstoavoidbyteswapping.2) Batchreadandwriteoperationsoperationstoreducei/ooover

Pakej Bytes GO: Rujukan dan Petua PendekPakej Bytes GO: Rujukan dan Petua PendekMay 08, 2025 am 12:05 AM

Pakej Bytes Go digunakan terutamanya untuk memproses irisan byte dengan cekap. 1) Menggunakan bait.Buffer boleh melakukan splicing rentetan dengan cekap untuk mengelakkan peruntukan memori yang tidak perlu. 2) Fungsi bait. Digunakan untuk membandingkan irisan byte dengan cepat. 3) Fungsi bytes.index, bytes.split dan bytes.ReplaceAll boleh digunakan untuk mencari dan memanipulasi kepingan byte, tetapi isu -isu prestasi perlu diberi perhatian.

Pakej Pergi Bytes: Contoh Praktikal untuk Manipulasi Slice BytePakej Pergi Bytes: Contoh Praktikal untuk Manipulasi Slice ByteMay 08, 2025 am 12:01 AM

Pakej byte menyediakan pelbagai fungsi untuk memproses irisan byte dengan cekap. 1) Gunakan bytes.Contains untuk memeriksa urutan byte. 2) Gunakan bytes.split untuk memecah irisan byte. 3) Gantikan urutan byte bytes.replace. 4) Gunakan bytes.join untuk menyambungkan kepingan byte berganda. 5) Gunakan bytes.buffer untuk membina data. 6) gabungan bytes.map untuk pemprosesan ralat dan pengesahan data.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

SecLists

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

Muat turun versi mac editor Atom

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular