recherche
Maisondéveloppement back-endGolangComment lire et analyser correctement les fichiers texte codés en UTF-16 dans Go ?

How to Correctly Read and Parse UTF-16 Encoded Text Files in Go?

Comment lire des fichiers texte UTF-16 dans des chaînes dans Go

Lorsqu'il s'agit de fichiers texte codés en UTF-16, le package bufio standard de Go peut ne pas interpréter les caractères Unicode correctement en raison de ses limites dans la gestion des sauts de ligne. Cela peut entraîner des problèmes de conversion du contenu du fichier en chaîne et de préservation des valeurs Unicode prévues.

Une solution consiste à utiliser la dernière version de golang.org/x/text/encoding/unicode, qui introduit l'Unicode. .BOMOverride. Cette fonction détecte intelligemment la marque d'ordre des octets (BOM) et décode le fichier en conséquence :

package main

import (
    "bytes"
    "fmt"
    "io/ioutil"
    "log"
    "strings"

    "golang.org/x/text/encoding/unicode"
    "golang.org/x/text/transform"
)

// ReadFileUTF16 is similar to ioutil.ReadFile() but decodes UTF-16.
func ReadFileUTF16(filename string) ([]byte, error) {
    raw, err := ioutil.ReadFile(filename)
    if err != nil {
        return nil, err
    }

    win16be := unicode.UTF16(unicode.BigEndian, unicode.IgnoreBOM)
    utf16bom := unicode.BOMOverride(win16be.NewDecoder())

    unicodeReader := transform.NewReader(bytes.NewReader(raw), utf16bom)

    decoded, err := ioutil.ReadAll(unicodeReader)
    return decoded, err
}

func main() {
    data, err := ReadFileUTF16("inputfile.txt")
    if err != nil {
        log.Fatal(err)
    }
    final := strings.Replace(string(data), "\r\n", "\n", -1)
    fmt.Println(final)
}

Pour gérer l'analyse de texte ligne par ligne, vous pouvez utiliser NewScannerUTF16 :

package main

import (
    "bufio"
    "fmt"
    "log"
    "os"

    "golang.org/x/text/encoding/unicode"
    "golang.org/x/text/transform"
)

type utfScanner interface {
    Read(p []byte) (n int, err error)
}

// NewScannerUTF16 creates a scanner similar to os.Open() but decodes the file as UTF-16.
func NewScannerUTF16(filename string) (utfScanner, error) {
    file, err := os.Open(filename)
    if err != nil {
        return nil, err
    }

    win16be := unicode.UTF16(unicode.BigEndian, unicode.IgnoreBOM)
    utf16bom := unicode.BOMOverride(win16be.NewDecoder())

    unicodeReader := transform.NewReader(file, utf16bom)
    return unicodeReader, nil
}

func main() {
    s, err := NewScannerUTF16("inputfile.txt")
    if err != nil {
        log.Fatal(err)
    }

    scanner := bufio.NewScanner(s)
    for scanner.Scan() {
        fmt.Println(scanner.Text())
    }
    if err := scanner.Err(); err != nil {
        fmt.Fprintln(os.Stderr, "reading inputfile:", err)
    }
}

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Interfaces et polymorphisme en Go: réutiliser le codeInterfaces et polymorphisme en Go: réutiliser le codeApr 29, 2025 am 12:31 AM

Interfaces andPolymorphisMingoenhanceCodeRelevitality andmainaipability.1) Définir les interfaces de théâtre.

Quel est le rôle de la fonction 'init' dans GO?Quel est le rôle de la fonction 'init' dans GO?Apr 29, 2025 am 12:28 AM

TheinitfonctioningorunsautomAticalement pour que la façon dont la convention est en train

Composition d'interface dans Go: construire des abstractions complexesComposition d'interface dans Go: construire des abstractions complexesApr 29, 2025 am 12:24 AM

Les combinaisons d'interface créent des abstractions complexes dans la programmation GO en décomposant les fonctions en petites interfaces focalisées. 1) Définissez le lecteur, l'écrivain et les interfaces plus étroites. 2) Créez des types complexes tels que le fichier et le réseau de réseaux en combinant ces interfaces. 3) Utilisez la fonction ProcessData pour montrer comment gérer ces interfaces combinées. Cette approche améliore la flexibilité du code, la testabilité et la réutilisabilité, mais il faut prendre soin d'éviter une fragmentation excessive et une complexité combinatoire.

Pièges et considérations potentielles lors de l'utilisation des fonctions d'initiés dans GoPièges et considérations potentielles lors de l'utilisation des fonctions d'initiés dans GoApr 29, 2025 am 12:02 AM

InitisctionsingoaReAutomAticalement compte tenu de la fin de la manière

Comment parcourez-vous une carte en Go?Comment parcourez-vous une carte en Go?Apr 28, 2025 pm 05:15 PM

L'article discute de l'itération des cartes dans GO, en se concentrant sur des pratiques sûres, en modifiant les entrées et en considérations de performance pour les grandes cartes.

Comment créez-vous une carte dans Go?Comment créez-vous une carte dans Go?Apr 28, 2025 pm 05:14 PM

L'article discute de la création et de la manipulation de cartes dans GO, y compris des méthodes d'initialisation et de l'ajout / mise à jour des éléments.

Quelle est la différence entre un tableau et une tranche en Go?Quelle est la différence entre un tableau et une tranche en Go?Apr 28, 2025 pm 05:13 PM

L'article traite des différences entre les tableaux et les tranches dans GO, en se concentrant sur la taille, l'allocation de la mémoire, le passage des fonctions et les scénarios d'utilisation. Les tableaux sont de taille fixe, alloués par la pile, tandis que les tranches sont dynamiques, souvent allouées au tas et plus flexibles.

Comment créez-vous une tranche dans GO?Comment créez-vous une tranche dans GO?Apr 28, 2025 pm 05:12 PM

L'article discute de la création et de l'initialisation des tranches en Go, y compris l'utilisation des littéraux, la fonction de faire et de couper des tableaux ou des tranches existantes. Il couvre également la syntaxe de tranche et déterminant la longueur et la capacité des tranches.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

mPDF

mPDF

mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) ​​et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

Version Mac de WebStorm

Version Mac de WebStorm

Outils de développement JavaScript utiles

Navigateur d'examen sécurisé

Navigateur d'examen sécurisé

Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.