>  기사  >  Java  >  Java에서 문자 스트림을 사용하여 텍스트가 아닌 파일을 읽고 쓰는 방법

Java에서 문자 스트림을 사용하여 텍스트가 아닌 파일을 읽고 쓰는 방법

王林
王林앞으로
2023-04-18 19:04:041105검색

    문자 스트림을 사용하여 파일 읽기(텍스트 아님)

    파일 읽기에 Java의 문자 스트림을 예로 들면 다음과 같습니다. 0-65535 사이의 문자만 읽을 수 있습니다. 문자는 모두 양수임을 알 수 있습니다. 그러나 이진 바이트는 음수일 수 있습니다. 하지만 읽을 때는 양수로 읽혀지거나, 인코딩 테이블에서 찾을 수 없는 문자가 이상한 기호를 반환하게 됩니다(이상한 "?"를 본 적이 있을 것입니다).

    하지만 어떤 경우에는 바이너리 데이터를 표시하기 위해 문자를 사용해야 하는데 방법이 없습니다. 우리의 방법 중 하나인 base64 인코딩을 소개하겠습니다.

    Base64 인코딩

    base64 인코딩 소개

    base64는 인터넷에서 8Bit 바이트코드를 전송하는 데 사용되는 일반적인 인코딩 방법 중 하나입니다. Base64는 인쇄 가능한 64개의 문자를 기반으로 이진 데이터를 표현하는 방법입니다. Base64 인코딩은 바이너리에서 문자로의 프로세스이며 HTTP 환경에서 더 긴 식별 정보를 전송하는 데 사용할 수 있습니다. Base64 인코딩은 읽을 수 없으며 읽기 전에 디코딩해야 합니다. 중국어 이름은 이진 데이터를 나타내는 64개의 인쇄 가능한 문자를 기반으로 합니다.

    인코딩 규칙

    1. 3바이트를 4바이트로 변환합니다.

    2.

    3. 최종 터미네이터도 처리해야 합니다.

    인코딩 방법의 단점

    base64에서는 3개의 8Bit 바이트를 4개의 6Bit 문자(38 = 46 = 24)로 변환한 다음 두 개의 상위 비트 0을 6Bit에 추가해야 하는 인코딩 규칙에서 볼 수 있습니다. 4개의 8Bit 바이트로 구성됩니다. 즉, 변환된 문자열은 이론적으로 원본 문자열보다 1/3(33%) 더 길어집니다.

    콘셉트 소개와 좀 더 자세한 내용이 있으니 관심 있으신 분들은 모아서 자세히 알아보세요.

    Java에서 Base64 적용

    Java의 Base64 도구 클래스는 다음 세 가지 BASE64 코덱을 얻기 위한 정적 메서드 집합을 제공합니다.

    • 기본: 출력은 A-Za-z0-9 문자 집합에 매핑됩니다. /, 인코딩은 라인 마커를 추가하지 않으며 출력 디코딩은 A-Za-z0-9+/만 지원합니다.

    • URL: 출력은 A-Za-z0-9+_ 문자 집합에 매핑되며 출력은 URL과 파일입니다.

    • MIME: 출력은 암시적으로 MIME 친화적인 형식으로 매핑됩니다. 출력은 한 줄에 76자를 초과할 수 없으며 ’r’ 다음에 ’n’으로 구분되어야 합니다. 인코딩된 출력은 줄 분할 없이 종료됩니다.

    다음 메소드에 해당합니다.

    Encoder basicEncoder = Base64.getEncoder();
    Encoder mimeEncoder = Base64.getMimeEncoder();
    Encoder urlEncoder = Base64.getUrlEncoder();

    basic 인코더를 테스트하기 위해 간단한 도구 클래스를 작성했습니다. .

    package com.dragon;
    
    import java.io.BufferedInputStream;
    import java.io.ByteArrayOutputStream;
    import java.io.File;
    import java.io.FileInputStream;
    import java.io.FileNotFoundException;
    import java.io.IOException;
    import java.io.InputStream;
    import java.io.UnsupportedEncodingException;
    import java.util.Base64;
    import java.util.Base64.Decoder;
    import java.util.Base64.Encoder;
    
    /**
     * @author Alfred
     * */
    public class Base64Util {
    	private static Encoder encoder = Base64.getEncoder();
    	private static Decoder decoder = Base64.getDecoder();
    	private static String ENCODE = "UTF-8";
    	private static int LENGTH = 1024;
    	
    	/**
    	 * 静态方法:
    	 * 将文件等二进制数据(文本和非文本都可以)
    	 * 转为base64字符串。
    	 * @throws IOException 
    	 * @throws FileNotFoundException 
    	 * 
    	 * */
    	public static String dataToBase64(File src) throws FileNotFoundException, IOException {
    		Encoder encoder = Base64.getEncoder();
    		
    		int len = (int)src.length();
    		byte[] bar = new byte[(int)len];
    		int hasRead = 0;
    		byte[] b = new byte[LENGTH];
    		//使用专门处理 byte 的IO流比较方便,一次性读取较大文件对内存压力较大
    		try (InputStream in = new BufferedInputStream(new FileInputStream(src));
    				ByteArrayOutputStream bos = new ByteArrayOutputStream(len)) {
    			while ((hasRead = in.read(b)) != -1) {
    				bos.write(b, 0, hasRead);
    			}
    			bar = bos.toByteArray();
    		}
    		return encoder.encodeToString(bar);
    	}
    	
    	public static String dataToBase64(String src) throws UnsupportedEncodingException {
    		return encoder.encodeToString(src.getBytes(ENCODE));
    	}
    	
    	public static byte[] base64ToData(String src) {
    		return decoder.decode(src);
    	}
    }

    읽고 쓰기 위해 이미지를 Base64 문자열로 변환

    import java.io.BufferedReader;
    import java.io.BufferedWriter;
    import java.io.File;
    import java.io.FileNotFoundException;
    import java.io.FileReader;
    import java.io.FileWriter;
    import java.io.IOException;
    import java.io.UnsupportedEncodingException;
    import java.io.Writer;
    import java.nio.file.Path;
    import java.nio.file.Paths;
    
    public class Base64Test {
    	public static void main(String[] args) throws FileNotFoundException, IOException {
    		testPic();
    	}
    	
    	static void testPic() throws FileNotFoundException, IOException {
    		// 测试图片文件。
    		Path picPath = Paths.get("./src/com/dragon/001.jpg");
    		File picFile = picPath.toFile();
    		String picToBase64 = Base64Util.dataToBase64(picFile);
    		System.out.println(picToBase64);
    		long oldSize = picFile.length();
    		long newSize = picToBase64.getBytes("UTF-8").length;
    		System.out.println("图片原始大小(字节):" + oldSize);
    		System.out.println("转换后数据大小(字节):" + newSize);
    		System.out.println("转换后比原来扩大的比例为:" + (double)(newSize-oldSize)/(double)oldSize + " %");
    		
    		//将数据写入文件
    		try (Writer writer = new BufferedWriter(new FileWriter("./src/com/dragon/002.txt"))) {
    			writer.write(picToBase64);
    		}
    		
    		//从文件中读取数据
    		String line = null;
    		try (BufferedReader reader = new BufferedReader(new FileReader("./src/com/dragon/002.txt"))){
    			line = reader.readLine();
    		}
    		System.out.println(picToBase64.equals(line));
    	}
    }

    스크린샷 실행 중

    Java에서 문자 스트림을 사용하여 텍스트가 아닌 파일을 읽고 쓰는 방법

    설명: 이미지를 base64 문자열로 변환한 후 문자 스트림을 사용하여 텍스트 파일을 작성한 다음 문자 스트림을 사용합니다. 읽어낸 다음 원래 문자열과 비교하면 결과는 true입니다. 이제 이미지 데이터 읽기가 완료되었습니다. 여기서는 이미지의 바이너리 데이터를 읽는 것이 아니라고 하셨겠지만 실제로는 모든 파일이 바이너리로 저장되어 있습니다! 또한 이 base64 문자열을 이미지로 직접 사용할 수도 있습니다.

    참고: 여기서는 아주 작은 사진을 선택했습니다. 원본 크기가 3639바이트에 불과하여 4KB도 안 되는 것을 알 수 있지만, 텍스트로 변환하면 용량이 커집니다(그래서, 매우 길게, 매우 길게 표시됩니다 ).

    테스트 사진

    Java에서 문자 스트림을 사용하여 텍스트가 아닌 파일을 읽고 쓰는 방법

    그럼 이 문자열이 위의 사진인지 어떻게 증명할 수 있는지 물어봐도 될까요? 이 작업도 쉽습니다. 프런트 엔드에 대해 알고 있다면 프런트 엔드 그림이 base64 문자열로 표시될 수 있다는 것을 알아야 합니다. 이를 테스트하기 위해 html 파일을 작성해 보겠습니다.

    image.html

    <!DOCTYPE>
    <html>
        <head>
            <meta charset="UTF-8"/>
            <title>base测试</title>
        </head>
        <body>
            <img src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAsICAoIBwsKCQoNDAsNERwSEQ8PESIZGhQcKSQrKigkJyctMkA3LTA9MCcnOEw5PUNFSElIKzZPVU5GVEBHSEX/2wBDAQwNDREPESESEiFFLicuRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUX/wAARCAFGAkQDASIAAhEBAxEB/8QAGgABAQEBAQEBAAAAAAAAAAAAAAMBBgIEBf/EADQQAQABAwEDCwQCAgIDAAAAAAABAgQRAwUhsRIUMTQ1U1VzdJKkQVFhcRMigZEjojLR8P/EABkBAQADAQEAAAAAAAAAAAAAAAABAgMEBf/EACIRAQABAgYDAQEAAAAAAAAAAAACAREDEhMxUWEhMjNBIv/aAAwDAQACEQMRAD8A+DEMbhk9K1HOAJAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAHb6XZ9h7ajhLWaPZ1h7ajhLXPLd7WD86ACrUAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAABxG9jc/dk9Lpo8AASAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAO30ezrD01HCWs0ez7D01HCWueW72sH5xAFWoAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADh9/wBT9Nx+WOmjwDeAmg3ewCgbwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAdvo9n2HpqOEtZo9nWHpqOEtc8t3tYPziAKtQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAHETj6SxsxhkY+rq/HgAf5CgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA7fR7PsPTUcJazS7PsPTUcJa55bvawfnEAVagAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAOHMZbiPuyd0ul4DZjDASGMAAAAAAAAAAAAD3Gjq1UxNOlqTE74mKJmJ/U4eZoqiumiaaorqmIimYmJmZ6MRO+QYFX9appqxFUTMTE7piY6YmHudDWpnFWlqROJnfTMboiJmf8RMTP2yDwAAAAAAAAAAAAAAADt9Hs+w9NRwlrNHs+w9NRwlrmlu9rB+dABDUAAAAAAAAAAAABuJmMxEzGM5xuxnGf9iK1swbyZzMcmcxumMb4JpmOmJj9xgL0YAJAAAAAAAAAAAAAAAAcRhjd7HTR4AAkAAAAAAAAAAAAdNsiLrTtraudS9/ir0LmKqaKqsRFMRyeTE7onfOPvKWzrmvTvbzXnWupr07fl6endURVXXiOmZmN0RM5iIxmcfl+LTfXVNMU03WvTTERERGrVEREdERGWc7uf5f5JuNWdTk8nlTqTM46cZznH4RZa793aFxTGjYTq13Fxp6s016tGpb00fyRFcxMzVGZpndEY+sft+3TRNdUxqUTqTOpqxFU6NM08mapmYz0zuommc/WqOnEOI1L671qJp1brW1KZmJmmrUmYmY3xOJl5m41qqqqp1dSaqscqZqnM4nMZ3/Sd/73otVF/LxqVTqaldU0xTM1TM0xGIjM9GPpjow84w2apqqmqqZmqZmZmZzMzPTMsW83QAAAAAAAAAAAAAA7fR7PsPTUcJazS7PsPTUcJa55bvawfnQAVagAAAAAAAAAAAD9O31P+Cma6qacU8rETO+mMR/jfE/fe/MbFVUdFUxuxumejOcJpWzOccz7orqp1rirUmmmYimnlRMxEznMb435wX1XK0645WcasfWZxun77v8AW58M1TMTmZnM5nM5zP3bVqVVREVVVVREzMRMzO/7l/CtMO1bvP1GsQ2GsAAAAAAAAAAAAAAAcRmWdLZyzGXTs8AASAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAO30ez7D01HCWs0uz7D01HCWueW72sH50AFWoAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADiJ/LM4bM5ZHS6vx4AAUAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAHb6PZ9h7ajhLWaPZ9h7ajhLXPLd7WD86ACrUAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAABxE4Yf5HV+PAJ6QAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAdvo9n2HpqOEtZo9nWHpqOEtc8t3tYPziAKtQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAHEZhk9LcR92T0umlngACQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAB2+j2dYemo4S1mj2dYemo4S1zy3e1g/OIAq1AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAfk42V4X8ioxsrwv5FSA0zVefpx4Xxsrwv5FRjZXhfyKkAzVNOPC+NleF/IqMbK8L+RUgGappx4Xxsrwv5FRjZXhfyKkAzVNOPC+NleF/IqMbK8L+RUgGappx4Xxsrwv5FRjZXhfyKkAzVNOPC+NleF/IqMbK8L+RUgGappx4Xxsrwv5FRjZXhfyKkAzVNOPC+NleF/IqMbK8L+RUgGappx4Xxsrwv5FRjZXhfyKkAzVNOPC+NleF/IqMbK8L+RUgGappx4Xxsrwv5FRjZXhfyKkAzVNOPC+NleF/IqMbK8L+RUgGappx4Xxsrwv5FRjZXhfyKkAzVNOPC+NleF/IqMbK8L+RUgGappx4Xxsrwv5FRjZXhfyKkAzVNOPC+NleF/IqMbK8L+RUgGappx4Xxsrwv5FRjZXhfyKkAzVNOPDrtDRttSztpjQ5NMaVMU08qZ5MY3Rn6/t75tb9z/ANpZZ9QtfJp4Lo/W0KfyjzW37mfdLea2/df9pVBa3aPNbfup90nNbfup90rAW7R5rb91Puk5rb91PulYC3aPNbfup90nNbfup90rAW7R5rb91Puk5rb91PulYC3aPNbfup90nNbfup90rAW7R5rb91Puk5rb91PulYC3aPNbfup90nNbfup90rAW7R5rb91Puk5rb91PulYC3aPNbfup90nNbfup90rAW7R5rb91Puk5rb91PulYC3aPNbfup90nNbfup90rAW7R5rb91Puk5rb91PulYC3aPNbfup90nNbfup90rAW7R5rb91Puk5rb91PulYC3aPNbfup90nNbfup90rAW7R5rb91Puk5rb91PulYC3aPNbfup90iwFu3EADMAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAB2Fn1C18mnguhZdQtfJp4Li8PUAQuAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA4gBLEAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAB2Fn1C18mnguhZ9QtfJp4Li8PUAQuAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA4gBLEAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAB2Fn1C18mnguhZ9QtfJp4Li8PUAQuAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA4gBLEAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAB2Fn1C18mnguhZ9QtfJp4Li8PUAQuAAAAAAAAAAAABkADIAAAAAAAAAAAAAAAAAADiAEsQAAAAAAAAAAABTR/gzM3E6sRGMRpxE5++czH4TfRa3c2lU10aWnXXmJiquJmYjfmI+0zu3xvjAiuz6L62t9PX0o0o1KK9WqJnQqiM6dMzGImYmcTOd0TviOl9mps7QirUp0tGOTE1UxXVpa1e6JmM5jEZjHT0PzueaVOtRq0WdEalNcVzNWrVVmYnO/P5U09qcivR1KrWivU0qcRqTXVEzOZnOInH1n6SUUrSr6dn2NrrWtNerp01TivFUVTEzyfrMTVHTmOiP3MPM2Ohz3Xp5EcnT0qZp06ZmZrmrERMZmejP3xnD46dpXNGhoaVGpXTTpTMf1qmOVEzGI/ERjEftWraurVdzcTTE4oiimmqqZimImJ6emczG/9l0Wk+naWzre2t9XUoiqmY1JmnGJjEzERTO/oxmY+uH4769faFdxbzo1aOlFM4nNMTGJjdExGcbozGOjfnpfILxv+gAsAAAAAAAAAAAA7Cz6ha+TTwXQs+oWvk08FxeHqAIXAAAAAAAAAAG6cUzXTy/8Ax+u9hEzTVTVEZxMThKJeaL16enTFUx0xmYxEzEYj9/l5nSp5ETvziM8mcz0Z6JZVrzVTNPJiIqjEzl4muqrEVb6YxiI3fjpT4Y0jJX+Oj+XUiN/Jxin9/WP9mppcmI/pvmr6RMZjf90/5JmqqqaYnlYzE9G7H/or1a64iKojMYxP1j7/AOzwZZKzp6f9ojP9N0zysf8A32Qh7/nrmKt8xypznlTu/EQ8Fel4UlTcAVaAAAAAAAAAAAAAAOIASxAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAdhZ9QtfJp4LoWfULXyaeC4vD1AELgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAOIASxAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAdhZ9QtfJp4LoWfULXyaeC4vD1AELgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAOIASxAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAdhZdQtfJp4LoWfULXyaeC4vD1AELgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAOIASxAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAdhZdQtfJp4LoWfULXyaeC4vD1AELgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAOIASxAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAdhZdQtfJp4LgLw9QBC4AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAD//Z"/>
        </body>
    <html>

    브라우저를 열어 테스트해보세요

    Java에서 문자 스트림을 사용하여 텍스트가 아닌 파일을 읽고 쓰는 방법

    지침: 구체적인 사용법은 다음과 같습니다.

    67bbc4663cb75fc96833785f2fa7207d

    그림의 크기는 문자에 비해 실제로 매우 큽니다. . 여기에 있는 HTML 코드는 전체 이미지의 base64로 인코딩된 문자열이므로 내 블로그의 단어 수가 훨씬 더 커집니다.

    문자열을 base64로 인코딩

    public class Base64Test {
    	public static void main(String[] args) throws FileNotFoundException, IOException {
    		testStr("I love you yesterday and today!");
    	}
    	
    	static void testStr(String src) throws UnsupportedEncodingException {
    		//测试文本数据。
    		String strToBase64 = Base64Util.dataToBase64(src);
    		System.out.println("base64编码:" + strToBase64);
    		String base64ToStr = new String(Base64Util.base64ToData(strToBase64));
    		System.out.println("base64解码:" + base64ToStr);
    	}
    }

    테스트 스크린샷

    Java에서 문자 스트림을 사용하여 텍스트가 아닌 파일을 읽고 쓰는 방법

    base64 사용

    Base64는 일반적으로 텍스트 데이터가 처리되는 상황에서 일부 바이너리 데이터를 표현, 전송 및 저장하는 데 사용됩니다. MIME 이메일, MIME을 통한 이메일 포함, 복잡한 데이터를 XML로 저장합니다. 참고 1: 인터넷에는 인코딩 및 디코딩이 가능한 웹사이트가 많이 있습니다. 필요한 경우 시도해 볼 수 있습니다.

    注2:可以观察一下这个base64字符串的特点,我上次学习Java爬虫的时候,爬了一个网站,发现这个网站的一个 script 脚本中,含有一个json对象,其中有一个属性是 url,但是对应的链接却看不懂(base64字符串是不可读的),但是我感觉它就是base64字符串,所以我利用base64编解码网站解码一看,真的是一个网站的地址。然后,就可以写一个解码方法,当爬到这个数据时,给它解码了,哈哈。

    举一个简单的例子:

    {"url":"aHR0cHMlM0ElMkYlMkZ3d3cuYmFpZHUuY29tJTJG"}
    import java.io.UnsupportedEncodingException;
    import java.net.URLDecoder;
    import java.net.URLEncoder;
    import java.util.Base64;
    import java.util.Base64.Decoder;
    import java.util.Base64.Encoder;
    
    public class TestALittle {
    	public static void main(String[] args) throws UnsupportedEncodingException {
    		String base64Str = "aHR0cHMlM0ElMkYlMkZ3d3cuYmFpZHUuY29tJTJG";
    		String de_str = base64ToUrlEncoderToURL(base64Str);
    		System.out.println("解码:" + de_str);
    	}
    	
    	//base64解密为urlencoder,再解码为url
    	public static String base64ToUrlEncoderToURL(String base64Str) throws UnsupportedEncodingException {
    		Decoder decoder = Base64.getDecoder();
    		byte[] bt = decoder.decode(base64Str);
    		String en_str = new String(bt, 0, bt.length);
    		return URLDecoder.decode(en_str, "UTF-8");
    	}
    }

    Java에서 문자 스트림을 사용하여 텍스트가 아닌 파일을 읽고 쓰는 방법

    说明: 这个例子中的 url 进行了两次编码,第一次是将url中的非西欧字符编码(可以去了解一下为什么这么做?),然后再使用base64编码。但是,如果你掌握了解码技术,解码也是很简单的。(但是如果你看不出来它是base64编码,那估计就没有办法了!)

    위 내용은 Java에서 문자 스트림을 사용하여 텍스트가 아닌 파일을 읽고 쓰는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

    성명:
    이 기사는 yisu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제