Rumah  >  Artikel  >  pembangunan bahagian belakang  >  golang menggunakan aksara bercelaru

golang menggunakan aksara bercelaru

WBOY
WBOYasal
2023-05-22 11:56:37749semak imbas

Dalam beberapa tahun kebelakangan ini, bahasa Go (Golang) telah semakin digunakan secara meluas dalam bidang pembangunan bahagian belakang, tetapi ia adalah mudah untuk menghadapi watak bercelaru semasa penggunaan. Artikel ini akan meneroka sebab dan penyelesaian untuk menghadapi watak bercelaru di Golang.

1. Sebab masalah kod bercelaru

1. Pengekodan tidak konsisten

Rentetan Golang menggunakan pengekodan UTF-8 secara lalai, tetapi dalam beberapa senario, seperti membaca dan menulis pangkalan data, membaca Semasa menulis fail, format pengekodan mungkin tidak konsisten dengan UTF-8, menyebabkan aksara bercelaru.

Sebagai contoh, apabila kita membaca rentetan yang dikodkan gbk daripada pangkalan data, jika kita mengeluarkannya secara langsung dalam UTF-8, aksara yang bercelaru akan muncul.

2. Padanan set aksara

Masalah padanan set aksara dalam Golang juga boleh membawa kepada aksara yang bercelaru. Set aksara Unicode mengandungi aksara daripada banyak bahasa, tetapi jika set aksara yang berbeza digunakan, ketidakpadanan aksara akan berlaku, akhirnya membawa kepada aksara yang bercelaru.

Sebagai contoh, jika kita perlu menulis rentetan dengan aksara Cina ke dalam fail dengan set aksara Inggeris, aksara yang bercelaru mungkin muncul.

2. Penyelesaian untuk menyelesaikan masalah aksara bercelaru

1 Nyatakan format pengekodan

Apabila membaca dan menulis data luaran, kami boleh menentukan format pengekodan yang sepadan mengelakkan ketidakkonsistenan pengekodan. Jika kita membaca rentetan yang dikodkan gbk dalam pangkalan data, kita boleh menukarnya kepada rentetan yang dikodkan UTF-8 dan mengeluarkannya, seperti yang ditunjukkan di bawah:

import (
    "fmt"
    "github.com/axgle/mahonia"
)
 
func main() {
    // gbk编码字符串
    str := "你好"
    // 转换为UTF-8编码字符串
    enc := mahonia.NewDecoder("gbk")
    result := enc.ConvertString(str)
    fmt.Println(result)
}

Dalam contoh ini, kami menggunakan pustaka pihak ketiga "mahonia ", yang kaedah "NewDecoder" boleh menukar rentetan daripada satu format pengekodan kepada format lain.

2. Gunakan perpustakaan "unicode/utf8"

Pustaka "unicode/utf8" menyediakan banyak operasi berkaitan set aksara, yang boleh mengendalikan isu padanan set aksara dengan mudah. Kita boleh menggunakan kaedah "utf8.RuneCountInString" untuk mendapatkan bilangan aksara dalam rentetan dan mengelakkan ketidakpadanan set aksara apabila membandingkan.

Sebagai contoh, apabila kita perlu menulis rentetan yang mengandungi aksara Cina ke dalam fail dengan set aksara Inggeris, mula-mula kita boleh menggunakan kaedah "utf8.RuneCountInString" untuk mendapatkan bilangan aksara dalam rentetan itu dan kemudian gunakan kaedah "io. WriteString" untuk menulis, seperti yang ditunjukkan di bawah:

import (
    "io"
    "os"
    "unicode/utf8"
)
 
func main() {
    // 汉字字符串
    str := "你好"
    // 获取字符数量
    count := utf8.RuneCountInString(str)
    // 写入文件
    file, _ := os.OpenFile("test.txt", os.O_CREATE|os.O_WRONLY, 0644)
    defer file.Close()
    for _, r := range str {
        io.WriteString(file, string(r))
    }
}

Dalam contoh ini, kami menggunakan kaedah "utf8.RuneCountInString" untuk mendapatkan bilangan aksara dalam "str", dan apabila melintasi rentetan, gunakan kaedah " io.WriteString" untuk menulis.

3. Gunakan perpustakaan "bufio"

Pustaka "bufio" menyediakan jenis "Pembaca" dan "Penulis", yang boleh membaca dan menulis data daripada fail atau sambungan rangkaian, dan boleh Tentukan format pengekodan. Menggunakan perpustakaan "bufio" juga boleh mengelakkan masalah set aksara yang tidak konsisten, seperti yang ditunjukkan di bawah:

import (
    "bufio"
    "os"
)
 
func main() {
    // 打开文件
    file, _ := os.OpenFile("test.txt", os.O_CREATE|os.O_WRONLY, 0644)
    defer file.Close()
    // 以GBK编码写入数据
    writer := bufio.NewWriter(file)
    writer.WriteString("你好")
    writer.Flush()
    // 读取以GBK编码存储的数据
    file, _ = os.Open("test.txt")
    defer file.Close()
    // 读取数据
    reader := bufio.NewReader(file)
    str, _, _ := reader.ReadLine()
    fmt.Println(string(str))
}

Dalam contoh ini, kami menggunakan perpustakaan "bufio" untuk operasi menulis dan membaca fail, dan semasa menulis The GBK format pengekodan ditentukan.

Kesimpulan

Apabila pengaturcaraan di Golang, kita akan menghadapi pelbagai masalah pengekodan, antaranya watak bercelaru adalah perkara biasa. Artikel ini memperkenalkan punca dan penyelesaian kepada masalah kod bercelaru, dan berharap dapat membantu pembaca. Untuk mengelakkan masalah aksara bercelaru, kita mesti memberi perhatian khusus kepada pemadanan format pengekodan dan set aksara semasa proses pengekodan Jika perlu, kita boleh menggunakan perpustakaan yang sepadan untuk beroperasi.

Atas ialah kandungan terperinci golang menggunakan aksara bercelaru. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel sebelumnya:pemajuan nginx golangArtikel seterusnya:pemajuan nginx golang