recherche
MaisonJavaJavaBaseIntroduction à la solution aux fichiers CSV tronqués exportés par Java

Introduction à la solution aux fichiers CSV tronqués exportés par Java

1. Problème

Lorsque les données interrogées sont exportées sous forme de fichier xls (encodage UTF-8), les données sont normales mais lorsqu'elles sont exportées sous forme de fichier xls. Fichier CSV, les données du fichier sont des caractères chinois tronqués qui sont également codés en UTF-8. Lorsqu'ils sont exportés en codage GBK, l'affichage chinois est normal.

Je pensais que le problème était résolu. Lorsque j'ai exporté ultérieurement des données contenant des caractères latins (tels que ÀÆÊàÌ), les données exportées sous forme de fichier xls s'affichaient normalement. Lors de l'exportation sous forme de fichier CSV, les caractères latins du fichier. Le fichier était affiché sous la forme "?".

J'ai essayé de passer à d'autres méthodes d'encodage mais cela n'a pas fonctionné. J'ai trouvé une solution à ce problème en ligne.

2. Solution

Le fichier exporté en mode CSV ne contient pas d'informations de nomenclature par défaut En définissant l'identifiant de nomenclature (flux d'octets commençant par EF BB BF) pour le contenu à sortir, c'est-à-dire que ce problème peut être résolu. La méthode spécifique est la suivante : (Recommandé : tutoriel vidéo Java)

...
OutputStreamWriter outputStreamWriter = new OutputStreamWriter(response.getOutputStream(), "UTF-8");  
// 要输出的内容  
result = (String)contentMap.get(RESPONSE_RESULT);  
response.setHeader("Content-Disposition", "attachment;filename=test.csv");  
outputStreamWriter.write(new String(new byte[]{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF}));  
outputStreamWriter.write(result);  
outputStreamWriter.flush();

S'il est implémenté avec le flux OutputStream, les paramètres peuvent être modifiés comme suit :

out = response.getOutputStream();     
//加上UTF-8文件的标识字符      
out.write(new byte []{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF});

Remarque :

BOM : Byte Order Mark, marque d'ordre d'octet (ce qui suit est tiré de l'Encyclopédie Baidu)

Dans l'encodage UCS, il existe un code appelé "Zero width No-Break Space", qui est traduit en chinois par le caractère "Zero width No-Break Space", son encodage est FEFF. FFFE est un caractère qui n'existe pas dans UCS, il ne devrait donc pas apparaître dans la transmission réelle.

La spécification UCS recommande de transmettre les caractères "Zero width No-Break Space" avant de transmettre le flux d'octets. De cette façon, si le récepteur reçoit FEFF, cela indique que le flux d'octets est Big-Endian ; s'il reçoit FFFE, cela indique que le flux d'octets est Little-Endian. C'est pourquoi le caractère "Zero width No-Break Space" est également appelé BOM.

UTF-8 ne nécessite pas de nomenclature pour indiquer l'ordre des octets, mais peut utiliser une nomenclature pour indiquer l'encodage. Le codage UTF-8 pour le caractère « Zero width No-Break Space » est EF BB BF. Ainsi, si le récepteur reçoit un flux d'octets commençant par EF BB BF, il sait qu'il est codé en UTF-8. Windows utilise BOM pour marquer l'encodage des fichiers texte.

Pour plus de connaissances sur Java, veuillez faire attention à la colonne Tutoriel de base Java.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Quels sont les différents algorithmes de collecte des ordures en Java (série, parallèle, CMS, G1, ZGC)?Quels sont les différents algorithmes de collecte des ordures en Java (série, parallèle, CMS, G1, ZGC)?Mar 14, 2025 pm 05:06 PM

L'article traite de divers algorithmes de collecte de ordures Java (série, parallèle, CMS, G1, ZGC), leurs impacts de performance et leur pertinence pour les applications avec de grands tas.

Qu'est-ce que la machine virtuelle Java (JVM) et comment fonctionne-t-elle en interne?Qu'est-ce que la machine virtuelle Java (JVM) et comment fonctionne-t-elle en interne?Mar 14, 2025 pm 05:05 PM

L'article traite de la machine virtuelle Java (JVM), détaillant son rôle dans l'exécution des programmes Java sur différentes plateformes. Il explique les processus internes de JVM, les composants clés, la gestion de la mémoire, la collecte des ordures et l'optimizatio des performances

Comment utiliser le moteur Nashorn de Java pour les scripts avec JavaScript?Comment utiliser le moteur Nashorn de Java pour les scripts avec JavaScript?Mar 14, 2025 pm 05:00 PM

Le moteur Nashorn de Java permet des scripts JavaScript dans les applications Java. Les étapes clés comprennent la configuration de Nashorn, la gestion des scripts et l'optimisation des performances. Les principaux problèmes impliquent la sécurité, la gestion de la mémoire et la compatibilité future due à Nashorn's Deprec

Comment utiliser l'instruction TRY-With-Resources de Java pour la gestion automatique des ressources?Comment utiliser l'instruction TRY-With-Resources de Java pour la gestion automatique des ressources?Mar 14, 2025 pm 04:59 PM

Le TRY-With-Resources de Java simplifie la gestion des ressources en fermant automatiquement les ressources comme des flux de fichiers ou des connexions de base de données, en améliorant la lisibilité du code et la maintenabilité.

Comment utiliser les énumérations de Java pour représenter des ensembles de valeurs fixes?Comment utiliser les énumérations de Java pour représenter des ensembles de valeurs fixes?Mar 14, 2025 pm 04:57 PM

Les énumérations Java représentent des ensembles de valeurs fixes, offrant une sécurité, une lisibilité et des fonctionnalités supplémentaires via des méthodes et des constructeurs personnalisés. Ils améliorent l'organisation du code et peuvent être utilisés dans les instructions de commutation pour une gestion efficace de la valeur.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Télécharger la version Mac de l'éditeur Atom

Télécharger la version Mac de l'éditeur Atom

L'éditeur open source le plus populaire

Adaptateur de serveur SAP NetWeaver pour Eclipse

Adaptateur de serveur SAP NetWeaver pour Eclipse

Intégrez Eclipse au serveur d'applications SAP NetWeaver.

PhpStorm version Mac

PhpStorm version Mac

Le dernier (2018.2.1) outil de développement intégré PHP professionnel

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

mPDF

mPDF

mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) ​​et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),