Apakah pengekodan Base64? Sebelum menjawab soalan ini, kita perlu memahami klasifikasi fail dalam komputer Bagi komputer, fail boleh dibahagikan kepada dua kategori, satu fail teks dan satu lagi fail binari.
Untuk fail binari, kandungan diwakili dalam binari, yang tidak dapat difahami dengan segera oleh manusia. Jika anda cuba membuka fail binari dengan penyunting teks, anda mungkin melihat omong kosong. Ini kerana kaedah pengekodan fail binari adalah berbeza daripada kaedah pengekodan fail teks, jadi apabila penyunting teks cuba menterjemah fail binari ke dalam kandungan teks, aksara bercelaru akan muncul.
Untuk fail teks, terdapat banyak kaedah pengekodan, seperti pengekodan ASCII yang terawal dan kaedah pengekodan yang biasa digunakan pada masa ini seperti UTF-8 dan UTF-16. Walaupun ia adalah fail teks, anda mungkin melihat aksara bercelaru jika anda membukanya menggunakan pengekodan yang berbeza.
Jadi sama ada fail teks atau fail binari, format pengekodan perlu disatukan. Dengan kata lain, bagaimana rupa pengekodan penulisan, maka pengekodan bacaan data juga harus sepadan dengannya.
Pengekodan Base64 sebenarnya ialah kaedah pengekodan yang mengekod data binari ke dalam aksara ASCII visual.
Mengapa terdapat keperluan sedemikian?
Kami tahu bahawa perkembangan dunia komputer tidak berlaku dalam sekelip mata Ia adalah proses pertumbuhan yang perlahan Untuk pengekodan aksara, ia hanya menyokong pengekodan ASCII, dan kemudiannya berkembang kepada Unicode dan seterusnya. Oleh itu, untuk kebanyakan aplikasi, format pengekodan selain pengekodan ASCII tidak disokong Jadi bagaimana untuk memaparkan kod bukan ASCII dalam sistem ini?
Penyelesaian adalah dengan melakukan pemetaan pengekodan untuk memetakan aksara bukan ASCII kepada aksara ASCII. Base64 ialah kaedah pengekodan sedemikian.
Tempat biasa untuk menggunakan Base64 adalah dalam halaman web Kadangkala kita perlu memaparkan imej pada halaman web, jadi kita boleh base64 mengekod imej dan kemudian mengisinya ke dalam html.
Aplikasi lain adalah untuk mengekodkan base64 fail dan kemudian menghantarnya sebagai lampiran e-mel.
Memandangkan pengekodan base64 sangat mudah digunakan, mari kita lihat pelaksanaan base64 dalam JAVA.
Terdapat pelaksanaan base64 yang sepadan dalam java, dipanggil java.util.Base64. Kelas ini ialah kelas alat untuk Base64, yang diperkenalkan oleh JDK dalam versi 1.8.
Base64 menyediakan tiga kaedah getEncoder dan getDecoder Dengan mendapatkan Pengekod dan Penyahkod yang sepadan, anda kemudian boleh memanggil kaedah pengekodan dan penyahkod untuk mengekod dan menyahkod data, yang sangat mudah.
Mari kita lihat dahulu contoh penggunaan asas Base64:
// 使用encoder进行编码 String encodedString = Base64.getEncoder().encodeToString("what is your name baby?".getBytes("utf-8")); System.out.println("Base64编码过后的字符串 :" + encodedString); // 使用encoder进行解码 byte[] decodedBytes = Base64.getDecoder().decode(encodedString); System.out.println("解码过后的字符串: " + new String(decodedBytes, "utf-8"));
Sebagai kelas alat, kelas alat Base64 yang disediakan dalam JDK masih sangat berguna.
Saya tidak akan menerangkan penggunaannya secara terperinci di sini Artikel ini terutamanya menganalisis cara Base64 dilaksanakan dalam JDK.
Kelas Base64 dalam JDK menyediakan tiga kaedah pengekod, iaitu getEncoder, getUrlEncoder dan getMimeEncoder:
public static Encoder getEncoder() { return Encoder.RFC4648; } public static Encoder getUrlEncoder() { return Encoder.RFC4648_URLSAFE; } public static Encoder getMimeEncoder() { return Encoder.RFC2045; }
Begitu juga, ia adalah Tiga penyahkod yang sepadan turut disediakan, iaitu getDecoder, getUrlDecoder, getMimeDecoder:
public static Decoder getDecoder() { return Decoder.RFC4648; } public static Decoder getUrlDecoder() { return Decoder.RFC4648_URLSAFE; } public static Decoder getMimeDecoder() { return Decoder.RFC2045; }
Seperti yang dapat dilihat daripada kod, ketiga-tiga pengekodan ini sepadan dengan RFC4648, RFC4648_URLSAFE dan RFC2045 masing-masing.
Ketiga-tiga ini adalah semua varian pengekodan base64. Mari kita lihat perbezaannya:
编码名称 | 编码字符 | 编码字符 | 编码字符 |
---|---|---|---|
第62位 | 第63位 | 补全符 | |
RFC 2045: Base64 transfer encoding for MIME | + |
/ |
= mandatory |
RFC 4648: base64 (standard) | + |
/ |
= optional |
RFC 4648: base64url (URL- and filename-safe standard) | - |
_ |
= optional |
Anda boleh melihat bahawa perbezaan antara base64 dan Base64url ialah bit ke-62 dan ke-63 pengekodan aksara adalah berbeza, dan perbezaan antara base64 untuk MIME dan base64 ialah sama ada aksara penyiapan adalah wajib.
Selain itu, untuk Basic dan base64url, aksara pemisah baris tidak akan ditambah, manakala base64 untuk MIME akan menambah 'r' dan 'n' sebagai pemisah baris selepas baris melebihi 76 aksara.
Akhir sekali, jika semasa proses penyahkodan, aksara yang tidak wujud dalam jadual pemetaan Base64 didapati diproses secara berbeza, base64 dan Base64url secara langsung akan menolaknya, manakala base64 untuk MIME akan mengabaikannya.
Perbezaan antara base64 dan Base64url boleh dilihat melalui dua kaedah berikut:
private static final char[] toBase64 = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/' };rrree
Untuk MIME, bilangan maksimum aksara dalam baris dan aksara baris baharu ditentukan:
private static final char[] toBase64URL = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '-', '_' };
Secara amnya, panjang objek yang kami kodkan dengan Base64 adalah tetap Kami hanya perlu menukar objek input kepada tatasusunan bait untuk memanggil kaedah pengekodan atau penyahkod.
Tetapi dalam beberapa kes kita perlu menukar data strim Dalam kes ini, kita boleh menggunakan dua kaedah membungkus Strim yang disediakan dalam Base64:
private static final int MIMELINEMAX = 76; private static final byte[] CRLF = new byte[] {'\r', '\n'};
public OutputStream wrap(OutputStream os) { Objects.requireNonNull(os); return new EncOutputStream(os, isURL ? toBase64URL : toBase64, newline, linemax, doPadding); }
Kedua-dua kaedah ini masing-masing Sesuai dengan pengekod dan. penyahkod.
Atas ialah kandungan terperinci Bagaimana untuk melaksanakan pengekod base64 di Jawa. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!