Wie gehen Sie mit Byte Order Marks (BOMs) um, wenn Sie Unicode-Dateien in Go lesen?-Golang-php.cn

Heim

Backend-Entwicklung

Golang

Wie gehen Sie mit Byte Order Marks (BOMs) um, wenn Sie Unicode-Dateien in Go lesen?

Susan Sarandon

Nov 04, 2024 am 02:57 AM

How do you handle Byte Order Marks (BOMs) when reading Unicode files in Go?

Lesen von Dateien mit Byte Order Marks (BOMs) in Go

Beim Lesen von Unicode-Dateien kann es erforderlich sein, auf eine Byte Order Mark (BOM) zu stoßen besondere Handhabung. Gibt es standardisierte oder empfohlene Methoden für den Umgang mit Stücklisten in Go, anstatt manuell nach einer Stückliste zu suchen und diese zu verwerfen?

Standardmethode zum Lesen von Stücklisten

Am Auf der Ebene der Kernbibliothek gibt es keine standardisierte Methode zur spezifischen Handhabung von Stücklisten. Die standardmäßigen Go-Bibliotheken zeichnen sich jedoch dadurch aus, dass sie Vorgänge auf niedriger Ebene ausführen, was die Implementierung benutzerdefinierter Stücklistenverarbeitungsmechanismen vereinfacht.

Beispielimplementierungen

Verwendung eines Buffered Leser:

Ein gepufferter Leser bietet einen komfortablen Ansatz zur Verwaltung von Stücklisten. Indem ein gepufferter Reader um den Eingabedateideskriptor gewickelt wird, kann die Stückliste effizient überprüft und verworfen werden, wie im folgenden Beispiel zu sehen ist:

<code class="go">import (
    "bufio"
    "os"
    "log"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        log.Fatal(err)
    }
    defer closeOrDie(fd)
    br := bufio.NewReader(fd)
    r, _, err := br.ReadRune()
    if err != nil {
        log.Fatal(err)
    }
    if r != '\uFEFF' {
        br.UnreadRune() // Not a BOM -- put the rune back
    }
    // Now work with br as you would do with fd
    // ...
}</code>

Verwendung der io.Seeker-Schnittstelle:

Für Objekte, die die io.Seeker-Schnittstelle implementieren, besteht ein alternativer Ansatz darin, die ersten drei Bytes der Datei zu lesen und auf das Stücklistenmuster zu prüfen. Wenn keine Stückliste gefunden wird, kann der Dateideskriptor mit io.Seek() an den Anfang zurückgespult werden, wie unten dargestellt:

<code class="go">import (
    "os"
    "log"
)

func main() {
    fd, err := os.Open("filename")
    if err != nil {
        log.Fatal(err)
    }
    defer closeOrDie(fd)
    bom := [3]byte
    _, err = io.ReadFull(fd, bom[:])
    if err != nil {
        log.Fatal(err)
    }
    if bom[0] != 0xef || bom[1] != 0xbb || bom[2] != 0xbf {
        _, err = fd.Seek(0, 0) // Not a BOM -- seek back to the beginning
        if err != nil {
            log.Fatal(err)
        }
    }
    // The next read operation on fd will read real data
    // ...
}</code>

Beachten Sie, dass in diesen Beispielen davon ausgegangen wird, dass die Datei in UTF-8 codiert ist. Wenn es sich um andere oder unbekannte Kodierungen handelt, ist möglicherweise weitere Logik erforderlich.

Das obige ist der detaillierte Inhalt vonWie gehen Sie mit Byte Order Marks (BOMs) um, wenn Sie Unicode-Dateien in Go lesen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

Aufbau skalierbarer Systeme mit der Go -ProgrammierspracheApr 25, 2025 am 12:19 AM

GoisidealforbuildingsCalablesSystemsDuetoitsSimplicity, Effizienz und verblüfftem Inconcurrencysupport.1) Go'ScleanSyNtaxandminimalisticDeInenHanceProductivity und ReduzienEirrors.2) ItsgoroutinesandchannelsableCrentCrent-Programme, Distrioutines und ChannelenableCrent-Programme, DistributingworkloNecrent-Programme,

Best Practices für die Verwendung von Init -Funktionen effektiv in GoApr 25, 2025 am 12:18 AM

Initunctionsingorunautomatischbeforemain () und sarEsfulForsSetingupenvironmentsandinitializingVariables

Die Ausführungsreihenfolge der Init -Funktionen in Go -PaketenApr 25, 2025 am 12:14 AM

GoinitializespackagesintheordertheyareImported, SheexecuteStfunctionSwitHinapackageInredeDinitionorder und FileNamesDeterminetheorderacrossmultipleFiles

Definieren und Verwenden von benutzerdefinierten Schnittstellen in GoApr 25, 2025 am 12:09 AM

CustomInterFacesingoarecrucialForwritingFlexible, Wartelable und testableCode

Verwenden von Schnittstellen zum Verspotten und Testen in GoApr 25, 2025 am 12:07 AM

Der Grund für die Verwendung von Schnittstellen für Simulation und Test ist, dass die Schnittstelle die Definition von Verträgen ohne Angabe von Implementierungen ermöglicht, wodurch die Tests isolierter und einfacher werden. 1) Die implizite Implementierung der Schnittstelle erleichtert es einfach, Scheinobjekte zu erstellen, die reale Implementierungen bei den Tests ersetzen können. 2) Die Verwendung von Schnittstellen kann die tatsächliche Implementierung des Dienstes in Unit -Tests problemlos ersetzen und die Komplexität und die Zeit der Tests reduzieren. 3) Die von der Schnittstelle bereitgestellte Flexibilität ermöglicht Änderungen des simulierten Verhaltens für verschiedene Testfälle. 4) Schnittstellen helfen von Anfang an, Testable -Code zu entwerfen und die Modularität und Wartbarkeit des Codes zu verbessern.

Verwenden von Init für die Paketinitialisierung in GoApr 24, 2025 pm 06:25 PM

In Go wird die Init -Funktion für die Paketinitialisierung verwendet. 1) Die Init -Funktion wird automatisch bei der Paketinitialisierung aufgerufen und ist geeignet, um globale Variablen zu initialisieren, Verbindungen zu setzen und Konfigurationsdateien zu laden. 2) Es kann mehrere Init -Funktionen geben, die in Dateireihenfolge ausgeführt werden können. 3) Bei der Verwendung sollten die Ausführungsreihenfolge, die Testschwierigkeit und die Leistungsauswirkungen in Betracht gezogen werden. 4) Es wird empfohlen, Nebenwirkungen zu reduzieren, die Abhängigkeitsinjektion zu verwenden und die Initialisierung zu verzögern, um die Verwendung von Init -Funktionen zu optimieren.

GO's Select Anweisung: Multiplexing gleichzeitige OperationenApr 24, 2025 pm 05:21 PM

GO'SSelectstatementsTreamlinesConcurrentProgrammingByMultiplexingoperationen.1) ITallowswaitingonMultiPhanneloperationen, ExecutingTheFirstreadyone) TheDefaultCasepreventsDeadlocksByAntheProgramtoprosectroseverifnooperation.3) itcanpeusedefoursend

Erweiterte Genauigkeitstechniken in Go: Kontext und KarteigruppenApr 24, 2025 pm 05:09 PM

Contextandwaitgroupsarecrucialingoforminggoroutineseffektiv.1) contextAllowSsignalingCancellationanddeadlinesAcrossapiobears, Sicherstellung von Goroutinescanbesten

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Assassin's Creed Shadows: Seashell Riddle -Lösung

4 Wochen vorByDDD

Was ist neu in Windows 11 KB5054979 und wie Sie Update -Probleme beheben

3 Wochen vorByDDD

Wo kann man die Kransteuerungsschlüsselkarten in Atomfall finden

4 Wochen vorByDDD

<🎜>: Dead Rails - wie man jede Herausforderung abschließt

1 Monate vorByDDD

Atomfall Guide: Gegenstandsstandorte, Questführer und Tipps

1 Monate vorByDDD

Heiße Werkzeuge

SublimeText3 Englische Version

Empfohlen: Win-Version, unterstützt Code-Eingabeaufforderungen!

ZendStudio 13.5.1 Mac

Leistungsstarke integrierte PHP-Entwicklungsumgebung

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.