>백엔드 개발 >Golang >Go에서 UTF-8로 인코딩되지 않은 텍스트 파일을 읽고 쓰는 방법은 무엇입니까?

Go에서 UTF-8로 인코딩되지 않은 텍스트 파일을 읽고 쓰는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-04 20:40:12951검색

How to Read and Write Non-UTF-8 Encoded Text Files in Go?

Go에서 UTF-8이 아닌 텍스트 파일 읽기 및 쓰기

백그라운드

By 기본적으로 Go의 표준 라이브러리는 텍스트 파일이 UTF-8로 인코딩된 것으로 가정합니다. 그러나 GBK와 같이 다른 인코딩으로 인코딩된 텍스트 파일이 발생할 수 있는 시나리오도 있습니다.

해결책

UTF-8이 아닌 텍스트 파일을 읽고 쓰려면 Go에서는 다음 단계를 사용할 수 있습니다.

비UTF-8 읽기 파일

  1. 필요한 패키지 가져오기: import "golang.org/x/text/encoding/simplifiedchinese"
    이 패키지는 GB18030, GBK 및 HZ를 제공합니다. -GB2312 인코딩 구현.
  2. transform.NewReader를 사용하여 io.Reader 만들기:

    f, err := os.Open(filename)
    if err != nil {
        log.Fatal(err)
    }
    r := transform.NewReader(f, simplifiedchinese.GBK.NewDecoder())

비UTF 쓰기- 8 파일

  1. 동일 패키지 가져오기: import "golang.org/x/text/encoding/simplifiedchinese"
  2. 다음을 사용하여 io.Writer를 만듭니다. 변환.NewWriter:

    f, err := os.Create(filename)
    if err != nil {
        log.Fatal(err)
    }
    w := transform.NewWriter(f, simplifiedchinese.GBK.NewEncoder())

다음 예는 GBK로 인코딩된 텍스트 파일을 읽고 쓰는 방법을 보여줍니다. :

import (
    "bufio"
    "fmt"
    "log"
    "os"

    "golang.org/x/text/encoding/simplifiedchinese"
    "golang.org/x/text/transform"
)

func main() {
    const filename = "example_GBK_file"
    exampleWriteGBK(filename)
    exampleReadGBK(filename)
}

func exampleReadGBK(filename string) {
    f, err := os.Open(filename)
    if err != nil {
        log.Fatal(err)
    }

    r := transform.NewReader(f, simplifiedchinese.GBK.NewDecoder())

    sc := bufio.NewScanner(r)
    for sc.Scan() {
        fmt.Printf("Read line: %s\n", sc.Bytes())
    }
    if err := sc.Err(); err != nil {
        log.Fatal(err)
    }

    if err := f.Close(); err != nil {
        log.Fatal(err)
    }
}

func exampleWriteGBK(filename string) {
    f, err := os.Create(filename)
    if err != nil {
        log.Fatal(err)
    }

    w := transform.NewWriter(f, simplifiedchinese.GBK.NewEncoder())

    // Write some text from the Wikipedia GBK page that includes Chinese
    _, err = fmt.Fprintln(w,
        `In 1995, China National Information Technology Standardization
Technical Committee set down the Chinese Internal Code Specification
(Chinese: 汉字内码扩展规范(GBK); pinyin: Hànzì Nèimǎ
Kuòzhǎn Guīfàn (GBK)), Version 1.0, known as GBK 1.0, which is a
slight extension of Codepage 936. The newly added 95 characters were not
found in GB 13000.1-1993, and were provisionally assigned Unicode PUA
code points.`)
    if err != nil {
        log.Fatal(err)
    }

    if err := f.Close(); err != nil {
        log.Fatal(err)
    }
}

이 코드는 GBK로 인코딩된 텍스트를 엽니다. 파일을 읽고 그 내용을 읽고 이를 다른 GBK 인코딩 텍스트 파일에 씁니다.

위 내용은 Go에서 UTF-8로 인코딩되지 않은 텍스트 파일을 읽고 쓰는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.