Rumah >Java >javaTutorial >Cara menggunakan aliran aksara untuk membaca dan menulis fail bukan teks dalam Java
Ambil strim aksara Java untuk membaca fail sebagai contoh: ia hanya boleh membaca Untuk aksara antara 0-65535, dapat dilihat bahawa aksara semuanya adalah nombor positif, tetapi bait binari boleh menjadi nombor negatif. Tetapi apabila membaca, ia akan dibaca sebagai nombor positif, atau aksara yang tidak ditemui dalam jadual pengekodan akan mengembalikan simbol pelik (anda mungkin pernah melihat "?" yang aneh itu).
Tetapi dalam beberapa kes, aksara mesti digunakan untuk memaparkan data perduaan. Tidak ada cara. Pengekodan Base64
Peraturan pengekodan1 Tukarkan 3 bait kepada 4 bait
2 .
3. Penamat akhir juga mesti diproses.
Kelemahan kaedah pengekodan
Berikut ialah pengenalan kepada konsep dan kandungan yang lebih terperinci Jika anda berminat, anda boleh mengakses koleksi untuk mengetahui lebih lanjut.
Aplikasi Base64 dalam Java
Encoder basicEncoder = Base64.getEncoder(); Encoder mimeEncoder = Base64.getMimeEncoder(); Encoder urlEncoder = Base64.getUrlEncoder();asas
. .
Tukar imej kepada rentetan Base64 untuk membaca dan menulispackage com.dragon; import java.io.BufferedInputStream; import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import java.io.UnsupportedEncodingException; import java.util.Base64; import java.util.Base64.Decoder; import java.util.Base64.Encoder; /** * @author Alfred * */ public class Base64Util { private static Encoder encoder = Base64.getEncoder(); private static Decoder decoder = Base64.getDecoder(); private static String ENCODE = "UTF-8"; private static int LENGTH = 1024; /** * 静态方法: * 将文件等二进制数据(文本和非文本都可以) * 转为base64字符串。 * @throws IOException * @throws FileNotFoundException * * */ public static String dataToBase64(File src) throws FileNotFoundException, IOException { Encoder encoder = Base64.getEncoder(); int len = (int)src.length(); byte[] bar = new byte[(int)len]; int hasRead = 0; byte[] b = new byte[LENGTH]; //使用专门处理 byte 的IO流比较方便,一次性读取较大文件对内存压力较大 try (InputStream in = new BufferedInputStream(new FileInputStream(src)); ByteArrayOutputStream bos = new ByteArrayOutputStream(len)) { while ((hasRead = in.read(b)) != -1) { bos.write(b, 0, hasRead); } bar = bos.toByteArray(); } return encoder.encodeToString(bar); } public static String dataToBase64(String src) throws UnsupportedEncodingException { return encoder.encodeToString(src.getBytes(ENCODE)); } public static byte[] base64ToData(String src) { return decoder.decode(src); } }
import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException; import java.io.UnsupportedEncodingException; import java.io.Writer; import java.nio.file.Path; import java.nio.file.Paths; public class Base64Test { public static void main(String[] args) throws FileNotFoundException, IOException { testPic(); } static void testPic() throws FileNotFoundException, IOException { // 测试图片文件。 Path picPath = Paths.get("./src/com/dragon/001.jpg"); File picFile = picPath.toFile(); String picToBase64 = Base64Util.dataToBase64(picFile); System.out.println(picToBase64); long oldSize = picFile.length(); long newSize = picToBase64.getBytes("UTF-8").length; System.out.println("图片原始大小(字节):" + oldSize); System.out.println("转换后数据大小(字节):" + newSize); System.out.println("转换后比原来扩大的比例为:" + (double)(newSize-oldSize)/(double)oldSize + " %"); //将数据写入文件 try (Writer writer = new BufferedWriter(new FileWriter("./src/com/dragon/002.txt"))) { writer.write(picToBase64); } //从文件中读取数据 String line = null; try (BufferedReader reader = new BufferedReader(new FileReader("./src/com/dragon/002.txt"))){ line = reader.readLine(); } System.out.println(picToBase64.equals(line)); } }Jalankan tangkapan skrin
Penjelasan: Selepas menukar imej kepada rentetan base64, fail teks ditulis menggunakan aliran aksara, dan kemudian dibaca menggunakan aliran aksara, dan kemudian dibandingkan dengan rentetan asal, hasilnya adalah benar.
Jadi, bacaan data imej selesai Mungkin anda mengatakan bahawa apa yang anda baca di sini bukanlah data binari imej, tetapi sebenarnya, semua fail disimpan dalam binari! Selain itu, rentetan base64 ini juga boleh digunakan secara langsung sebagai imej.Nota: Saya telah memilih gambar yang sangat kecil di sini Anda dapat melihat bahawa saiz asal hanya 3639 bait, iaitu kurang daripada 4 KB, tetapi jika ia ditukar kepada teks, ia akan menjadi. banyak (
Jadi, ia akan kelihatan sangat panjang, sangat panjang).
Uji gambar
Kemudian anda mungkin bertanya bagaimana untuk membuktikan bahawa rentetan ini ialah gambar di atas? Ini juga mudah dilakukan Jika anda mengetahui sesuatu tentang bahagian hadapan, anda harus tahu bahawa gambar bahagian hadapan boleh diwakili oleh rentetan base64 Mari tulis fail html untuk mengujinya.
image.html<!DOCTYPE> <html> <head> <meta charset="UTF-8"/> <title>base测试</title> </head> <body> <img src=""/> </body> <html>Buka penyemak imbas untuk mengujinya
Penerangan: Penggunaan khususnya adalah seperti berikut:
67bbc4663cb75fc96833785f2fa7207d
Saiz gambar sebenarnya sangat besar berbanding dengan aksara. Kod html yang saya ada di sini ialah rentetan terkod base64 bagi imej lengkap, dan kemudian bilangan perkataan blog saya menjadi lebih besar.
String ke pengekodan base64
public class Base64Test { public static void main(String[] args) throws FileNotFoundException, IOException { testStr("I love you yesterday and today!"); } static void testStr(String src) throws UnsupportedEncodingException { //测试文本数据。 String strToBase64 = Base64Util.dataToBase64(src); System.out.println("base64编码:" + strToBase64); String base64ToStr = new String(Base64Util.base64ToData(strToBase64)); System.out.println("base64解码:" + base64ToStr); } }Uji tangkapan skrin
Penggunaan base64
注2:可以观察一下这个base64字符串的特点,我上次学习Java爬虫的时候,爬了一个网站,发现这个网站的一个 script 脚本中,含有一个json对象,其中有一个属性是 url,但是对应的链接却看不懂(base64字符串是不可读的),但是我感觉它就是base64字符串,所以我利用base64编解码网站解码一看,真的是一个网站的地址。然后,就可以写一个解码方法,当爬到这个数据时,给它解码了,哈哈。
举一个简单的例子:
{"url":"aHR0cHMlM0ElMkYlMkZ3d3cuYmFpZHUuY29tJTJG"}
import java.io.UnsupportedEncodingException; import java.net.URLDecoder; import java.net.URLEncoder; import java.util.Base64; import java.util.Base64.Decoder; import java.util.Base64.Encoder; public class TestALittle { public static void main(String[] args) throws UnsupportedEncodingException { String base64Str = "aHR0cHMlM0ElMkYlMkZ3d3cuYmFpZHUuY29tJTJG"; String de_str = base64ToUrlEncoderToURL(base64Str); System.out.println("解码:" + de_str); } //base64解密为urlencoder,再解码为url public static String base64ToUrlEncoderToURL(String base64Str) throws UnsupportedEncodingException { Decoder decoder = Base64.getDecoder(); byte[] bt = decoder.decode(base64Str); String en_str = new String(bt, 0, bt.length); return URLDecoder.decode(en_str, "UTF-8"); } }
说明: 这个例子中的 url 进行了两次编码,第一次是将url中的非西欧字符编码(可以去了解一下为什么这么做?),然后再使用base64编码。但是,如果你掌握了解码技术,解码也是很简单的。(但是如果你看不出来它是base64编码,那估计就没有办法了!)
Atas ialah kandungan terperinci Cara menggunakan aliran aksara untuk membaca dan menulis fail bukan teks dalam Java. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!