Maison  >  Article  >  Java  >  Comment utiliser le flux de caractères pour lire et écrire des fichiers non texte en Java

Comment utiliser le flux de caractères pour lire et écrire des fichiers non texte en Java

王林
王林avant
2023-04-18 19:04:041120parcourir

    Utilisez le flux de caractères pour lire des fichiers (non textuels)

    Prenons l'exemple du flux de caractères de Java pour lire des fichiers : il ne peut lire que les caractères compris entre 0 et 65535. On peut voir que les caractères sont tous positifs. nombres. Mais l’octet binaire peut être négatif. Mais lors de la lecture, il sera lu comme un nombre positif, ou un caractère introuvable dans la table d'encodage renverra un symbole étrange (vous avez peut-être vu cet étrange "?").

    Mais dans certains cas, des caractères doivent être utilisés pour afficher des données binaires, et il n'y a aucun moyen de présenter l'une de nos méthodes - encodage base64.

    Codage Base64

    Introduction au codage base64

    base64 est l'une des méthodes de codage courantes utilisées pour transmettre du bytecode 8 bits sur Internet. Base64 est une méthode de représentation de données binaires basée sur 64 caractères imprimables. Le codage Base64 est un processus allant du binaire aux caractères, qui peut être utilisé pour transmettre des informations d'identification plus longues dans un environnement HTTP. Le codage Base64 est illisible et doit être décodé avant de pouvoir être lu. Son nom chinois est basé sur 64 caractères imprimables pour représenter des données binaires.

    Règles de codage

    1. Convertissez 3 octets en 4 octets

    2.

    3. Le terminateur final doit également être traité.

    Inconvénients de la méthode de codage

    Il ressort des règles de codage que base64 nécessite de convertir tous les trois octets de 8 bits en quatre caractères de 6 bits (38 = 46 = 24), puis d'ajouter deux 0 de poids fort au 6 bits, composé de quatre octets de 8 bits. En d’autres termes, la chaîne convertie sera théoriquement 1/3 (33 %) plus longue que la chaîne d’origine.

    Voici une introduction à un concept et un contenu plus détaillé Si vous êtes intéressé, vous pouvez le récupérer pour en savoir plus.

    Application de Base64 en Java

    La classe d'outils Base64 de Java fournit un ensemble de méthodes statiques pour obtenir les trois codecs BASE64 suivants :

    • Basique : la sortie est mappée sur un ensemble de caractères A-Za-z0-9 + /, l'encodage n'ajoute aucun marqueur de ligne et le décodage de sortie ne prend en charge que A-Za-z0-9+/.

    • URL : La sortie correspond à un ensemble de caractères A-Za-z0-9+_, la sortie est une URL et un fichier.

    • MIME : la sortie est implicitement mappée à un format convivial MIME. Le résultat ne doit pas comporter plus de 76 caractères par ligne et être séparé par "r" suivi de "n". La sortie codée se termine sans division de ligne.

    correspond aux méthodes suivantes :

    Encoder basicEncoder = Base64.getEncoder();
    Encoder mimeEncoder = Base64.getMimeEncoder();
    Encoder urlEncoder = Base64.getUrlEncoder();

    J'ai écrit une classe d'outils simple pour tester l'encodeur basic. .

    package com.dragon;
    
    import java.io.BufferedInputStream;
    import java.io.ByteArrayOutputStream;
    import java.io.File;
    import java.io.FileInputStream;
    import java.io.FileNotFoundException;
    import java.io.IOException;
    import java.io.InputStream;
    import java.io.UnsupportedEncodingException;
    import java.util.Base64;
    import java.util.Base64.Decoder;
    import java.util.Base64.Encoder;
    
    /**
     * @author Alfred
     * */
    public class Base64Util {
    	private static Encoder encoder = Base64.getEncoder();
    	private static Decoder decoder = Base64.getDecoder();
    	private static String ENCODE = "UTF-8";
    	private static int LENGTH = 1024;
    	
    	/**
    	 * 静态方法:
    	 * 将文件等二进制数据(文本和非文本都可以)
    	 * 转为base64字符串。
    	 * @throws IOException 
    	 * @throws FileNotFoundException 
    	 * 
    	 * */
    	public static String dataToBase64(File src) throws FileNotFoundException, IOException {
    		Encoder encoder = Base64.getEncoder();
    		
    		int len = (int)src.length();
    		byte[] bar = new byte[(int)len];
    		int hasRead = 0;
    		byte[] b = new byte[LENGTH];
    		//使用专门处理 byte 的IO流比较方便,一次性读取较大文件对内存压力较大
    		try (InputStream in = new BufferedInputStream(new FileInputStream(src));
    				ByteArrayOutputStream bos = new ByteArrayOutputStream(len)) {
    			while ((hasRead = in.read(b)) != -1) {
    				bos.write(b, 0, hasRead);
    			}
    			bar = bos.toByteArray();
    		}
    		return encoder.encodeToString(bar);
    	}
    	
    	public static String dataToBase64(String src) throws UnsupportedEncodingException {
    		return encoder.encodeToString(src.getBytes(ENCODE));
    	}
    	
    	public static byte[] base64ToData(String src) {
    		return decoder.decode(src);
    	}
    }

    Convertissez l'image en chaîne Base64 pour la lecture et l'écriture

    import java.io.BufferedReader;
    import java.io.BufferedWriter;
    import java.io.File;
    import java.io.FileNotFoundException;
    import java.io.FileReader;
    import java.io.FileWriter;
    import java.io.IOException;
    import java.io.UnsupportedEncodingException;
    import java.io.Writer;
    import java.nio.file.Path;
    import java.nio.file.Paths;
    
    public class Base64Test {
    	public static void main(String[] args) throws FileNotFoundException, IOException {
    		testPic();
    	}
    	
    	static void testPic() throws FileNotFoundException, IOException {
    		// 测试图片文件。
    		Path picPath = Paths.get("./src/com/dragon/001.jpg");
    		File picFile = picPath.toFile();
    		String picToBase64 = Base64Util.dataToBase64(picFile);
    		System.out.println(picToBase64);
    		long oldSize = picFile.length();
    		long newSize = picToBase64.getBytes("UTF-8").length;
    		System.out.println("图片原始大小(字节):" + oldSize);
    		System.out.println("转换后数据大小(字节):" + newSize);
    		System.out.println("转换后比原来扩大的比例为:" + (double)(newSize-oldSize)/(double)oldSize + " %");
    		
    		//将数据写入文件
    		try (Writer writer = new BufferedWriter(new FileWriter("./src/com/dragon/002.txt"))) {
    			writer.write(picToBase64);
    		}
    		
    		//从文件中读取数据
    		String line = null;
    		try (BufferedReader reader = new BufferedReader(new FileReader("./src/com/dragon/002.txt"))){
    			line = reader.readLine();
    		}
    		System.out.println(picToBase64.equals(line));
    	}
    }

    Exécution d'une capture d'écran

    Comment utiliser le flux de caractères pour lire et écrire des fichiers non texte en Java

    Description : Après avoir converti l'image en chaîne base64, utilisez le flux de caractères pour écrire un fichier texte, puis utilisez le flux de caractères est lu, puis comparé à la chaîne d'origine, le résultat est vrai. Ainsi, la lecture des données de l'image est terminée. Peut-être avez-vous dit ici que vous ne lisiez pas les données binaires de l'image, mais en fait, tous les fichiers sont stockés en binaire ! De plus, cette chaîne base64 peut également être utilisée directement comme image.

    Remarque : j'ai sélectionné une très petite image ici. Vous pouvez voir que la taille originale n'est que de 3639 octets, soit moins de 4 Ko, mais si elle est convertie en texte, c'est beaucoup (Donc, c'est beaucoup). paraîtra Très long, très long ).

    Photo de test

    Comment utiliser le flux de caractères pour lire et écrire des fichiers non texte en Java

    Ensuite, vous pouvez demander comment prouver que cette chaîne est l'image ci-dessus ? C'est également facile à faire si vous connaissez quelque chose sur le front-end, sachez que les images du front-end peuvent être représentées par des chaînes base64. Écrivons un fichier html pour le tester.

    image.html

    <!DOCTYPE>
    <html>
        <head>
            <meta charset="UTF-8"/>
            <title>base测试</title>
        </head>
        <body>
            <img src=""/>
        </body>
    <html>

    Ouvrez le navigateur pour le tester

    Comment utiliser le flux de caractères pour lire et écrire des fichiers non texte en Java

    Instructions : Son utilisation spécifique est la suivante :

    67bbc4663cb75fc96833785f2fa7207d

    La taille de l'image est en fait très énorme par rapport aux personnages . Le code HTML que j'ai ici est la chaîne codée en base64 de l'image complète, puis le nombre de mots de mon blog devient beaucoup plus grand.

    Chaîne encodage en base64

    public class Base64Test {
    	public static void main(String[] args) throws FileNotFoundException, IOException {
    		testStr("I love you yesterday and today!");
    	}
    	
    	static void testStr(String src) throws UnsupportedEncodingException {
    		//测试文本数据。
    		String strToBase64 = Base64Util.dataToBase64(src);
    		System.out.println("base64编码:" + strToBase64);
    		String base64ToStr = new String(Base64Util.base64ToData(strToBase64));
    		System.out.println("base64解码:" + base64ToStr);
    	}
    }

    Test des captures d'écran

    Comment utiliser le flux de caractères pour lire et écrire des fichiers non texte en Java

    Utilisation de base64

    Base64 est souvent utilisé pour représenter, transmettre et stocker certaines données binaires dans des situations où les données texte sont généralement traitées. Y compris le courrier électronique MIME, le courrier électronique via MIME, le stockage de données complexes au format XML. Remarque 1 : Il existe également de nombreux sites Web sur Internet qui peuvent effectuer l'encodage et le décodage. Si vous avez besoin de l'utiliser, vous pouvez l'essayer.

    注2:可以观察一下这个base64字符串的特点,我上次学习Java爬虫的时候,爬了一个网站,发现这个网站的一个 script 脚本中,含有一个json对象,其中有一个属性是 url,但是对应的链接却看不懂(base64字符串是不可读的),但是我感觉它就是base64字符串,所以我利用base64编解码网站解码一看,真的是一个网站的地址。然后,就可以写一个解码方法,当爬到这个数据时,给它解码了,哈哈。

    举一个简单的例子:

    {"url":"aHR0cHMlM0ElMkYlMkZ3d3cuYmFpZHUuY29tJTJG"}
    import java.io.UnsupportedEncodingException;
    import java.net.URLDecoder;
    import java.net.URLEncoder;
    import java.util.Base64;
    import java.util.Base64.Decoder;
    import java.util.Base64.Encoder;
    
    public class TestALittle {
    	public static void main(String[] args) throws UnsupportedEncodingException {
    		String base64Str = "aHR0cHMlM0ElMkYlMkZ3d3cuYmFpZHUuY29tJTJG";
    		String de_str = base64ToUrlEncoderToURL(base64Str);
    		System.out.println("解码:" + de_str);
    	}
    	
    	//base64解密为urlencoder,再解码为url
    	public static String base64ToUrlEncoderToURL(String base64Str) throws UnsupportedEncodingException {
    		Decoder decoder = Base64.getDecoder();
    		byte[] bt = decoder.decode(base64Str);
    		String en_str = new String(bt, 0, bt.length);
    		return URLDecoder.decode(en_str, "UTF-8");
    	}
    }

    Comment utiliser le flux de caractères pour lire et écrire des fichiers non texte en Java

    说明: 这个例子中的 url 进行了两次编码,第一次是将url中的非西欧字符编码(可以去了解一下为什么这么做?),然后再使用base64编码。但是,如果你掌握了解码技术,解码也是很简单的。(但是如果你看不出来它是base64编码,那估计就没有办法了!)

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

    Déclaration:
    Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer
    Article précédent:Comment appliquer CAS en JavaArticle suivant:Comment appliquer CAS en Java