什麼是Base64編碼呢?在回答這個問題之前,我們需要了解一下電腦中文件的分類,對於電腦來說文件可以分為兩類,一類是文字文件,一類是二進位。
對於二進位檔案來說,其內容是用二進位來表示的,對於人類是不可立刻理解的。如果你嘗試用文字編輯器開啟二進位文件,可能會看到亂碼。這是因為二進位檔案的編碼方式和文字檔案的編碼方式是不一樣的,所以當文字編輯器嘗試將二進位檔案翻譯成為文字內容的時候,就會出現亂碼。
對於文字檔案來說,也有很多種編碼方式,例如最早的ASCII編碼和目前常用的UTF-8和UTF-16等編碼方式。即使是文字文件,如果你使用不同的編碼方式打開,也可能會看到亂碼。
所以不管是文字檔案或是二進位檔案也好,都需要進行編碼格式的統一。也就是說寫入的編碼是什麼樣子的,那麼資料讀取的編碼也應該要符合。
Base64編碼其實就是將二進位資料編碼成為視覺化ASCII字元的一種編碼方式。
為什麼會有這樣的要求呢?
我們知道電腦世界的發展不是一蹴可幾的,它是一個慢慢成長的過程,對於字元編碼來說,最早只支援ASCII編碼,後面才擴展到Unicode等。所以對於許多應用來說除了ASCII編碼之外的其他編碼格式是不支援的,那麼如何在這些系統中展示非ASCII code呢?
解決的方式就是進行編碼映射,將非ASCII的字元映射成為ASCII的字元。而base64就是這樣的一種編碼方式。
常見的使用Base64的地方就是在web網頁中,有時候我們需要在網頁中展示圖片,那麼可以將圖片進行base64編碼,然後填入html。
還有一種應用程式就是將檔案進行base64編碼,然後再作為郵件的附件進行傳送。
既然base64編碼這麼好用,接下來我們來看看JAVA中的base64實作。
java中有一個對應的base64實現,叫做java.util.Base64。這個類是Base64的工具類,是JDK在1.8版本引進的。
Base64中提供了三個getEncoder和getDecoder方法,透過取得對應的Encoder和Decoder,然後可以呼叫Encoder的encode和decode方法對資料進行編碼和解碼,非常的方便。
我們先來看看Base64的基本使用範例:
// 使用encoder进行编码 String encodedString = Base64.getEncoder().encodeToString("what is your name baby?".getBytes("utf-8")); System.out.println("Base64编码过后的字符串 :" + encodedString); // 使用encoder进行解码 byte[] decodedBytes = Base64.getDecoder().decode(encodedString); System.out.println("解码过后的字符串: " + new String(decodedBytes, "utf-8"));
作為一個工具類,JDK中提供的Base64工具類還是很好用的。
這裡就不詳細解釋它的使用,這篇文章主要分析JDK中Base64是怎麼實現的。
JDK中Base64類別有提供了三個encoder方法,分別是getEncoder,getUrlEncoder和getMimeEncoder:
public static Encoder getEncoder() { return Encoder.RFC4648; } public static Encoder getUrlEncoder() { return Encoder.RFC4648_URLSAFE; } public static Encoder getMimeEncoder() { return Encoder.RFC2045; }
同樣的,它也提供了三個對應的decoder,分別是getDecoder,getUrlDecoder,getMimeDecoder:
public static Decoder getDecoder() { return Decoder.RFC4648; } public static Decoder getUrlDecoder() { return Decoder.RFC4648_URLSAFE; } public static Decoder getMimeDecoder() { return Decoder.RFC2045; }
從代碼中可以看出,這三種編碼分別對應的是RFC4648,RFC4648_URLSAFE和RFC2045。
這三種都屬於base64編碼的變體,我們看下他們有什麼區別:
#編碼名稱 | #編碼字符 | 編碼字元 | 編碼字元 |
---|---|---|---|
第62位元 | 第63位元 | 補全符 | |
RFC 2045: Base64 transfer encoding for MIME |
|
##/
|
= mandatory
|
| ##/
| = optional
|
|
- |
| _
| #= optional
|
private static final char[] toBase64 = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/' };
private static final char[] toBase64URL = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '-', '_' };而對MIME來說,定義了一個一行的最大字元個數,和換行符:
private static final int MIMELINEMAX = 76; private static final byte[] CRLF = new byte[] {'\r', '\n'};Base64的高階用法一般情況下我們用Base64進行編碼的物件長度是固定的,我們只需要將輸入物件轉換成為byte陣列即可呼叫encode或decode的方法。 但是在某些情況下我們需要對流資料進行轉換,這時候就可以用到Base64中提供的兩個對Stream進行wrap的方法:
public OutputStream wrap(OutputStream os) { Objects.requireNonNull(os); return new EncOutputStream(os, isURL ? toBase64URL : toBase64, newline, linemax, doPadding); }
public InputStream wrap(InputStream is) { Objects.requireNonNull(is); return new DecInputStream(is, isURL ? fromBase64URL : fromBase64, isMIME); }這兩個方法分別對應encoder和decoder。
以上是Java中的base64編碼器怎麼實現的詳細內容。更多資訊請關注PHP中文網其他相關文章!