cari
Rumahpembangunan bahagian belakangGolangBagaimanakah Saya Boleh Mengesan Urutan UTF-8 Byte Tidak Sah dalam Go?

How Can I Detect Invalid UTF-8 Byte Sequences in Go?

Mengesan Urutan Bait Tidak Sah dalam Go

Dalam Go, apabila menukar kepingan bait ([]bait) kepada rentetan, adalah mungkin untuk menemui urutan bait yang tidak sah yang tidak boleh diterjemahkan ke dalam Unicode. Ini timbul daripada fakta bahawa bukan semua jujukan bait mewakili aksara UTF-8 yang sah.

Untuk mengesan kejadian sedemikian, dua pendekatan tersedia:

Semakan Kesahan UTF-8:

Seperti yang disebut oleh Tim Cooper, fungsi utf8.Valid boleh digunakan untuk menguji sama ada kepingan bait mengandungi UTF-8 bait yang sah. Jika hasilnya palsu, ini menunjukkan kehadiran jujukan bait yang tidak sah.

Pertimbangan Penukaran Rentetan:

Bertentangan dengan andaian biasa, Go membenarkan penukaran bukan UTF -8 bait hirisan kepada rentetan. Walau bagaimanapun, adalah penting untuk ambil perhatian bahawa rentetan dalam Go pada asasnya ialah hirisan bait baca sahaja dan oleh itu boleh menampung bait yang tidak sah UTF-8.

Hanya dalam situasi tertentu Go secara automatik melaksanakan UTF- 8 penyahkodan:

  • Apabila melelaran pada rentetan menggunakan sintaks for i, r := range s, pembolehubah r mewakili a Titik kod Unicode (rune) dan sentiasa sah.
  • Apabila menukar daripada rentetan kepada hirisan rune (iaitu, []rune(s)), Go menyahkod keseluruhan rentetan kepada rune.

Dalam kedua-dua kes, aksara UTF-8 yang tidak sah digantikan dengan aksara gantian U FFFD. Penggantian ini mungkin tidak boleh diterima dalam semua aplikasi, jadi disyorkan untuk melakukan pengesahan UTF-8 yang jelas jika perlu.

Contoh:

Pertimbangkan program Go berikut:

package main

import (
    "fmt"
    "unicode/utf8"
)

func main() {
    a := []byte{0xff}
    s := string(a)

    // Check UTF-8 validity
    if utf8.Valid(a) {
        fmt.Println("Valid UTF-8")
    } else {
        fmt.Println("Invalid UTF-8")
    }

    // Output string
    fmt.Println(s)
}

Output:

Invalid UTF-8
�

Dalam contoh ini, hirisan bait a mengandungi jujukan bait yang tidak sah, menghasilkan mesej "UTF-8 tidak sah". Selepas itu, apabila menukarnya kepada rentetan, bait yang tidak sah diwakili oleh aksara gantian "�".

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengesan Urutan UTF-8 Byte Tidak Sah dalam Go?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Bagaimana saya menulis objek dan stub untuk ujian di GO?Bagaimana saya menulis objek dan stub untuk ujian di GO?Mar 10, 2025 pm 05:38 PM

Artikel ini menunjukkan penciptaan dan stub di GO untuk ujian unit. Ia menekankan penggunaan antara muka, menyediakan contoh pelaksanaan mengejek, dan membincangkan amalan terbaik seperti menjaga mocks fokus dan menggunakan perpustakaan penegasan. Articl

Bagaimana anda menulis ujian unit di GO?Bagaimana anda menulis ujian unit di GO?Mar 21, 2025 pm 06:34 PM

Artikel ini membincangkan ujian unit menulis di GO, meliputi amalan terbaik, teknik mengejek, dan alat untuk pengurusan ujian yang cekap.

Bagaimana saya boleh menentukan kekangan jenis tersuai untuk generik di GO?Bagaimana saya boleh menentukan kekangan jenis tersuai untuk generik di GO?Mar 10, 2025 pm 03:20 PM

Artikel ini meneroka kekangan jenis adat Go untuk generik. Ia memperincikan bagaimana antara muka menentukan keperluan jenis minimum untuk fungsi generik, meningkatkan keselamatan jenis dan kebolehgunaan semula kod. Artikel ini juga membincangkan batasan dan amalan terbaik

Bagaimana anda menggunakan alat PPROF untuk menganalisis prestasi GO?Bagaimana anda menggunakan alat PPROF untuk menganalisis prestasi GO?Mar 21, 2025 pm 06:37 PM

Artikel ini menerangkan cara menggunakan alat PPROF untuk menganalisis prestasi GO, termasuk membolehkan profil, mengumpul data, dan mengenal pasti kesesakan biasa seperti CPU dan isu memori.

Bagaimana saya boleh menggunakan alat pengesanan untuk memahami aliran pelaksanaan aplikasi saya?Bagaimana saya boleh menggunakan alat pengesanan untuk memahami aliran pelaksanaan aplikasi saya?Mar 10, 2025 pm 05:36 PM

Artikel ini meneroka menggunakan alat pengesanan untuk menganalisis aliran pelaksanaan aplikasi GO. Ia membincangkan teknik instrumentasi manual dan automatik, membandingkan alat seperti Jaeger, Zipkin, dan OpenTelemetry, dan menonjolkan visualisasi data yang berkesan

Terangkan tujuan Pakej Refleksi Go. Bilakah anda akan menggunakan refleksi? Apakah implikasi prestasi?Terangkan tujuan Pakej Refleksi Go. Bilakah anda akan menggunakan refleksi? Apakah implikasi prestasi?Mar 25, 2025 am 11:17 AM

Artikel ini membincangkan pakej GO's Reflect, yang digunakan untuk manipulasi kod runtime, bermanfaat untuk siri, pengaturcaraan generik, dan banyak lagi. Ia memberi amaran tentang kos prestasi seperti pelaksanaan yang lebih perlahan dan penggunaan memori yang lebih tinggi, menasihati penggunaan yang bijak dan terbaik

Bagaimana anda menentukan kebergantungan dalam fail go.mod anda?Bagaimana anda menentukan kebergantungan dalam fail go.mod anda?Mar 27, 2025 pm 07:14 PM

Artikel ini membincangkan menguruskan kebergantungan modul Go melalui Go.Mod, meliputi spesifikasi, kemas kini, dan resolusi konflik. Ia menekankan amalan terbaik seperti versi semantik dan kemas kini biasa.

Bagaimana anda menggunakan ujian yang didorong oleh jadual di GO?Bagaimana anda menggunakan ujian yang didorong oleh jadual di GO?Mar 21, 2025 pm 06:35 PM

Artikel ini membincangkan menggunakan ujian yang didorong oleh jadual di GO, satu kaedah yang menggunakan jadual kes ujian untuk menguji fungsi dengan pelbagai input dan hasil. Ia menyoroti faedah seperti kebolehbacaan yang lebih baik, penurunan duplikasi, skalabiliti, konsistensi, dan a

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

SublimeText3 versi Inggeris

SublimeText3 versi Inggeris

Disyorkan: Versi Win, menyokong gesaan kod!