Maison  >  Article  >  développement back-end  >  Comment puis-je lire des fichiers Unicode UTF-8 dans des chaînes wstring en C 11 ?

Comment puis-je lire des fichiers Unicode UTF-8 dans des chaînes wstring en C 11 ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-11-06 01:02:03313parcourir

How can I read Unicode UTF-8 files into wstrings in C  11?

Lecture de fichiers Unicode UTF-8 dans WStrings

Dans les environnements Windows, l'utilisation de C 11 offre la possibilité de lire Unicode (UTF-8) fichiers dans wstrings. Ceci est rendu possible grâce à l'utilisation de la facette std::codecvt_utf8.

facette std::codecvt_utf8

La facette std::codecvt_utf8 facilite la conversion entre UTF- 8 chaînes d'octets codées et des chaînes de caractères UCS2 ou UCS4. Cette polyvalence permet la lecture et l'écriture de fichiers texte et binaires UTF-8.

Utilisation

Une implémentation utilisant la facette implique la création d'un objet local qui encapsule la facette. et des informations spécifiques aux paramètres régionaux. En imprégnant un tampon de flux avec ces paramètres régionaux, la lecture de fichiers UTF-8 devient possible.

Un exemple d'implémentation utilisant cette approche est :

#include <sstream>
#include <fstream>
#include <codecvt>

std::wstring readFile(const char* filename)
{
    std::wifstream wif(filename);
    wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
    std::wstringstream wss;
    wss << wif.rdbuf();
    return wss.str();
}

int main()
{
    std::wstring wstr = readFile("a.txt");
    // Do something with your wstring
    return 0;
}

Paramètre global des paramètres régionaux

Alternativement, il est possible de définir la locale C globale avec la facette std::codecvt_utf8. Cette méthode garantit que tous les constructeurs par défaut std::locale renverront une copie des paramètres régionaux globaux, éliminant ainsi le besoin d'imprégnation explicite du tampon de flux.

Pour définir les paramètres régionaux globaux :

std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));

Avec ce paramètre, vous pouvez simplifier l'opération de lecture du fichier pour :

std::wifstream wif("a.txt");
std::wstringstream wss;
wss << wif.rdbuf();
std::wstring wstr = wss.str();

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn