찾다
백엔드 개발GolangGo에서 UTF-8로 인코딩되지 않은 텍스트 파일(예: GBK)을 읽는 방법은 무엇입니까?

How to Read Non-UTF-8 Encoded Text Files (e.g., GBK) in Go?

Go에서 UTF-8이 아닌 텍스트 파일 읽기

Go에서는 UTF-8이 아닌 텍스트 파일을 읽고 쓰는 것이 어려울 수 있습니다. 표준 라이브러리는 UTF-8 인코딩을 가정합니다. 이 문서에서는 이 문제를 다루고 Go의 하위 저장소를 사용하는 포괄적인 솔루션을 제공합니다.

문제:

UTF-8이 아닌 형식으로 인코딩된 텍스트 파일을 어떻게 읽을 수 있나요? , GBK와 같은 가시나요?

해결책:

UTF-8이 아닌 인코딩으로 파일을 읽으려면 golang.org/x/text/encoding 패키지를 활용합니다. 이 패키지는 UTF-8과의 변환을 용이하게 하는 일반 문자 인코딩을 위한 인터페이스를 정의합니다.

특히 GBK 인코딩의 경우 golang.org/x/text/encoding/simplifiedchinese 하위 패키지를 사용합니다. GB18030, GBK 및 HZ-GB2312 인코딩 구현을 제공합니다. 이러한 구현은 인코딩.인코딩 인터페이스를 구현합니다.

구현:

다음은 GBK 인코딩된 데이터의 읽기 및 쓰기를 보여주는 예입니다. 파일:

package main

import (
    "bufio"
    "fmt"
    "log"
    "os"

    "golang.org/x/text/encoding/simplifiedchinese"
    "golang.org/x/text/transform"
)

var enc = simplifiedchinese.GBK

func main() {
    // Example filename
    const filename = "example_GBK_file"

    exampleWriteGBK(filename)
    exampleReadGBK(filename)
}

func exampleReadGBK(filename string) {
    f, err := os.Open(filename)
    if err != nil {
        log.Fatal(err)
    }

    // Convert GBK to UTF-8 on the fly
    r := transform.NewReader(f, enc.NewDecoder())

    sc := bufio.NewScanner(r)
    for sc.Scan() {
        fmt.Printf("Read line: %s\n", sc.Bytes())
    }
    if err := sc.Err(); err != nil {
        log.Fatal(err)
    }
}

func exampleWriteGBK(filename string) {
    f, err := os.Create(filename)
    if err != nil {
        log.Fatal(err)
    }

    w := transform.NewWriter(f, enc.NewEncoder())

    // Example text with Chinese characters
    _, err = fmt.Fprintln(w,
        `In 1995, China National Information Technology Standardization
Technical Committee set down the Chinese Internal Code Specification
(Chinese: 汉字内码扩展规范(GBK); pinyin: Hànzì Nèimǎ
Kuòzhǎn Guīfàn (GBK)), Version 1.0, known as GBK 1.0, which is a
slight extension of Codepage 936. The newly added 95 characters were not
found in GB 13000.1-1993, and were provisionally assigned Unicode PUA
code points.`)
    if err != nil {
        log.Fatal(err)
    }
}

플레이그라운드:

https://go.dev/play/p/fFIy9VES6cL

위 내용은 Go에서 UTF-8로 인코딩되지 않은 텍스트 파일(예: GBK)을 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
GO에서 패키지 초기화에 Init을 사용합니다GO에서 패키지 초기화에 Init을 사용합니다Apr 24, 2025 pm 06:25 PM

GO에서는 INT 기능이 패키지 초기화에 사용됩니다. 1) INT 기능은 패키지 초기화시 자동으로 호출되며 글로벌 변수 초기화, 연결 설정 및 구성 파일로드에 적합합니다. 2) 파일 순서로 실행할 수있는 여러 개의 초기 함수가있을 수 있습니다. 3)이를 사용할 때 실행 순서, 테스트 난이도 및 성능 영향을 고려해야합니다. 4) 부작용을 줄이고, 종속성 주입을 사용하고, 초기화를 지연하여 초기 기능의 사용을 최적화하는 것이 좋습니다.

GO의 선택 설명 : 다중화 동시 작업GO의 선택 설명 : 다중화 동시 작업Apr 24, 2025 pm 05:21 PM

go'selectStatementsTreamLinesconcurramprogrammingBymultiplexingOperations.1) ItallowSwaitingOnMultipLechannelOperations, executingThefirStreadYone.2) thedefaultCasePreventsDeadLocksHavingThepRamToproCeedifNooperationSready.3) Itcanusedfored

GO의 고급 동시성 기술 : 컨텍스트 및 대기 그룹GO의 고급 동시성 기술 : 컨텍스트 및 대기 그룹Apr 24, 2025 pm 05:09 PM

Contextandwaitgroupsarecrucialingformaninggoroutineeseforoutineeseferfectial

마이크로 서비스 아키텍처를 사용하는 이점마이크로 서비스 아키텍처를 사용하는 이점Apr 24, 2025 pm 04:29 PM

goisbeneficialformicroservicesduetoitssimplicity, 효율성, AndrobustConcurrenCysupport.1) Go'sdesignempasizessimplicityandefficiency, 이상적인 formicroservices.2) itsconcurrencymodelusinggoroutinesandChannelsAnllingoSyhighconcrency.3) FASTCOMPI

Golang vs. Python : 장단점Golang vs. Python : 장단점Apr 21, 2025 am 12:17 AM

golangisidealforbuildingscalablesystemsdueToitsefficiencyandconcurrency

Golang 및 C : 동시성 대 원시 속도Golang 및 C : 동시성 대 원시 속도Apr 21, 2025 am 12:16 AM

Golang은 동시성에서 C보다 낫고 C는 원시 속도에서 Golang보다 낫습니다. 1) Golang은 Goroutine 및 Channel을 통해 효율적인 동시성을 달성하며, 이는 많은 동시 작업을 처리하는 데 적합합니다. 2) C 컴파일러 최적화 및 표준 라이브러리를 통해 하드웨어에 가까운 고성능을 제공하며 극도의 최적화가 필요한 애플리케이션에 적합합니다.

Golang을 사용하는 이유는 무엇입니까? 혜택과 장점이 설명되었습니다Golang을 사용하는 이유는 무엇입니까? 혜택과 장점이 설명되었습니다Apr 21, 2025 am 12:15 AM

Golang을 선택하는 이유는 다음과 같습니다. 1) 높은 동시성 성능, 2) 정적 유형 시스템, 3) 쓰레기 수집 메커니즘, 4) 풍부한 표준 라이브러리 및 생태계는 효율적이고 신뢰할 수있는 소프트웨어를 개발하기에 이상적인 선택입니다.

Golang vs. C : 성능 및 속도 비교Golang vs. C : 성능 및 속도 비교Apr 21, 2025 am 12:13 AM

Golang은 빠른 개발 및 동시 시나리오에 적합하며 C는 극도의 성능 및 저수준 제어가 필요한 시나리오에 적합합니다. 1) Golang은 쓰레기 수집 및 동시성 메커니즘을 통해 성능을 향상시키고, 고전성 웹 서비스 개발에 적합합니다. 2) C는 수동 메모리 관리 및 컴파일러 최적화를 통해 궁극적 인 성능을 달성하며 임베디드 시스템 개발에 적합합니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구