Maison >Java >javaDidacticiel >Pourquoi la conversion d'un tableau d'octets en chaîne et inversement entraîne-t-elle une perte de données ?

Pourquoi la conversion d'un tableau d'octets en chaîne et inversement entraîne-t-elle une perte de données ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-11-24 01:24:10309parcourir

Why Does Converting a Byte Array to String and Back Result in Data Loss?

Problèmes de conversion d'un tableau d'octets en chaîne et de retour en tableau d'octets

Malgré de nombreuses discussions sur ce sujet, un défi persistant demeure pour certains : la conversion un tableau d'octets en une chaîne et de nouveau en un tableau d'octets sans entraîner un tableau d'octets incompatible. Le problème apparaît lorsque des individus tentent de manipuler des données cryptées sous forme de chaînes au lieu de tableaux d'octets.

Dans l'exemple de code fourni, les processus de cryptage et de déchiffrement fonctionnent correctement lors de l'utilisation de tableaux d'octets. Cependant, lors de la conversion du tableau d'octets en chaîne et inversement, le tableau d'octets résultant s'écarte de l'original. Par conséquent, le processus de décryptage échoue. Plusieurs encodages de chaînes, dont UTF-8 et UTF-16, ont été testés sans succès.

Comprendre l'écart

Le problème sous-jacent découle de la nature des chaînes et des tableaux d'octets. Les chaînes sont conçues pour représenter du texte lisible par l'homme, et non des données binaires brutes. Lors du stockage de données cryptées dans des chaînes, cela introduit des divergences potentielles.

Éviter la perte de données

Pour éviter la perte de données lors de la conversion, il est crucial d'utiliser des encodages qui maintiennent un Mappage -à un entre les octets et les caractères. L'un de ces codages est ISO-8859-1, qui garantit que chaque séquence d'octets correspond à une séquence de caractères spécifique et vice versa.

Code optimisé avec ISO-8859-1

Pour résoudre le problème avec UTF-16, qui échoue pour deux raisons principales, l'extrait de code suivant démontre l'utilisation de ISO-8859-1 :

    String decoded = new String(encryptedByteArray, "ISO-8859-1");
    System.out.println("decoded:" + decoded);

    byte[] encoded = decoded.getBytes("ISO-8859-1"); 
    System.out.println("encoded:" + java.util.Arrays.toString(encoded));

    String decryptedText = encrypter.decrypt(encoded);

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn