


Wie gehe ich mit Byte Order Marks (BOMs) beim Lesen von CSV-Dateien in Java um?
Byte Order Mark verursacht Probleme beim Lesen von CSV-Dateien in Java
Byte Order Mark (BOM) kann am Anfang einiger CSV-Dateien vorhanden sein Dateien, aber nicht in allen. Wenn vorhanden, wird die Stückliste zusammen mit der ersten Zeile der Datei gelesen, was zu Problemen beim Vergleich von Zeichenfolgen führt.
So lösen Sie dieses Problem:
Lösung:
Implementieren Sie eine Wrapper-Klasse, UnicodeBOMInputStream, die das Vorhandensein einer Unicode-Stückliste am Anfang eines Eingabestreams erkennt. Wenn eine Stückliste erkannt wird, kann sie mit der Methode „skipBOM()“ entfernt werden.
Hier ist ein Beispiel der UnicodeBOMInputStream-Klasse:
import java.io.IOException; import java.io.InputStream; import java.io.PushbackInputStream; public class UnicodeBOMInputStream extends InputStream { private PushbackInputStream in; private BOM bom; private boolean skipped = false; public UnicodeBOMInputStream(InputStream inputStream) throws IOException { if (inputStream == null) throw new NullPointerException("Invalid input stream: null is not allowed"); in = new PushbackInputStream(inputStream, 4); byte[] bom = new byte[4]; int read = in.read(bom); switch (read) { case 4: if ((bom[0] == (byte) 0xFF) && (bom[1] == (byte) 0xFE) && (bom[2] == (byte) 0x00) && (bom[3] == (byte) 0x00)) { this.bom = BOM.UTF_32_LE; break; } else if ((bom[0] == (byte) 0x00) && (bom[1] == (byte) 0x00) && (bom[2] == (byte) 0xFE) && (bom[3] == (byte) 0xFF)) { this.bom = BOM.UTF_32_BE; break; } case 3: if ((bom[0] == (byte) 0xEF) && (bom[1] == (byte) 0xBB) && (bom[2] == (byte) 0xBF)) { this.bom = BOM.UTF_8; break; } case 2: if ((bom[0] == (byte) 0xFF) && (bom[1] == (byte) 0xFE)) { this.bom = BOM.UTF_16_LE; break; } else if ((bom[0] == (byte) 0xFE) && (bom[1] == (byte) 0xFF)) { this.bom = BOM.UTF_16_BE; break; } default: this.bom = BOM.NONE; break; } if (read > 0) in.unread(bom, 0, read); } public BOM getBOM() { return bom; } public UnicodeBOMInputStream skipBOM() throws IOException { if (!skipped) { in.skip(bom.bytes.length); skipped = true; } return this; } @Override public int read() throws IOException { return in.read(); } @Override public int read(byte[] b) throws IOException { return in.read(b, 0, b.length); } @Override public int read(byte[] b, int off, int len) throws IOException { return in.read(b, off, len); } @Override public long skip(long n) throws IOException { return in.skip(n); } @Override public int available() throws IOException { return in.available(); } @Override public void close() throws IOException { in.close(); } @Override public synchronized void mark(int readlimit) { in.mark(readlimit); } @Override public synchronized void reset() throws IOException { in.reset(); } @Override public boolean markSupported() { return in.markSupported(); } private enum BOM { NONE, UTF_8, UTF_16_LE, UTF_16_BE, UTF_32_LE, UTF_32_BE } }
Verwendung:
Verwenden Sie den UnicodeBOMInputStream-Wrapper als folgt:
import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; public class CSVReaderWithBOM { public static void main(String[] args) throws Exception { FileInputStream fis = new FileInputStream("test.csv"); UnicodeBOMInputStream ubis = new UnicodeBOMInputStream(fis); System.out.println("Detected BOM: " + ubis.getBOM()); System.out.print("Reading the content of the file without skipping the BOM: "); InputStreamReader isr = new InputStreamReader(ubis); BufferedReader br = new BufferedReader(isr); System.out.println(br.readLine()); br.close(); isr.close(); ubis.close(); fis.close(); fis = new FileInputStream("test.csv"); ubis = new UnicodeBOMInputStream(fis); isr = new InputStreamReader(ubis); br = new BufferedReader(isr); ubis.skipBOM(); System.out.print("Reading the content of the file after skipping the BOM: "); System.out.println(br.readLine()); br.close(); isr.close(); ubis.close(); fis.close(); } }
Mit diesem Ansatz können Sie CSV-Dateien mit oder ohne Stücklisten lesen und Probleme beim Zeichenfolgenvergleich vermeiden, die dadurch verursacht werden, dass die Stückliste in der ersten Zeile der Datei vorhanden ist.
Das obige ist der detaillierte Inhalt vonWie gehe ich mit Byte Order Marks (BOMs) beim Lesen von CSV-Dateien in Java um?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

JVM'SPERFORMANCEISCORTITITIONWITHOTHOTHERRUNTIMEN, OPFORMENTABALANCEFEED, Sicherheit und Produktivität.1) JVmusesjitCompilationfordynamicoptimierungen.2)

JavaachievsplattformIndependencethroughthejavavirtualMachine (JVM), Zulassung von CodetorunonanyPlatformWithajvm.1) codiscompiledIntobytecode, NotMachine-spezifischCode.2) bytecodeIsinterpreted bythejvm, ermöglicht, zu ermöglichen

ThejvmisanabstractComputingMachinecrucialForrunningjavaprogramsduToitSplatform-unabhängige Architektur.itincludes: 1) ClassloaderforFoLoading-Klassen, 2) Runtimedataardeatastorage, 3) ExeclectueNeginewitherdinterpreter, Jitcompiler, undgarbaglector

JvmhasaclosereLationship withtheosasittranslatesjavabyteCodeIntomachine-spezifische Struktur, ManagesMemory und HandlesGAGAGECollection

Die Java -Implementierung "einmal schreiben, überall rennen" wird in Bytecode zusammengestellt und auf einer Java Virtual Machine (JVM) ausgeführt. 1) Schreiben Sie Java -Code und kompilieren Sie ihn in Bytecode. 2) Bytecode läuft auf einer beliebigen Plattform, wobei JVM installiert ist. 3) Verwenden Sie die Java Native Interface (JNI), um plattformspezifische Funktionen zu verarbeiten. Trotz Herausforderungen wie JVM-Konsistenz und der Verwendung von plattformspezifischen Bibliotheken verbessert Wora die Entwicklungseffizienz und die Flexibilität der Bereitstellung erheblich.

JavaachievesplattformIndependencethroughthejavavirtualMachine (JVM), die Codetorunondifferentoperatingsystems mit der Modifizierung von TheJVMCompilesjavacodeIntoplatform-inindivespendentBytecode, abgerechnet, abtrakt, abtret, abtrakt,

JavaispowerfulDuetoitsplattformindependenz, objektorientierteNature, Richstandardlibrary, PerformanceCapabilities, andstrongSecurityFeatures.1) PlattformindependenceAllowsApplicationStorunonanyDevicesupportingjava)

Zu den Top-Java-Funktionen gehören: 1) objektorientierte Programmierung, Unterstützung von Polymorphismus, Verbesserung der Code-Flexibilität und -wartbarkeit; 2) Ausnahmebehörigkeitsmechanismus, Verbesserung der Code-Robustheit durch Try-Catch-finaler Blöcke; 3) Müllsammlung, Vereinfachung des Speichermanagements; 4) Generika, Verbesserung der Art Sicherheit; 5) ABBDA -Ausdrücke und funktionale Programmierung, um den Code prägnanter und ausdrucksstärker zu gestalten; 6) Reiche Standardbibliotheken, die optimierte Datenstrukturen und Algorithmen bereitstellen.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

MantisBT
Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

DVWA
Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

SAP NetWeaver Server-Adapter für Eclipse
Integrieren Sie Eclipse mit dem SAP NetWeaver-Anwendungsserver.

Sicherer Prüfungsbrowser
Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

SecLists
SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.
