首頁  >  文章  >  Java  >  Java中字符流與位元組流的區別詳細介紹

Java中字符流與位元組流的區別詳細介紹

黄舟
黄舟原創
2017-03-25 10:33:322310瀏覽

這篇文章主要介紹了詳解Java中字符流與字節流的區別的相關資料,需要的朋友可以參考下

Java中字符流與字節流的區別

1. 什麼是流

    Java中的流是位元組序列的抽象,我們可以想像有水管,只不過現在流動在水管中的不再是水,而是位元組序列。和水流一樣,Java中的流也具有一個“流動的方向”,通常可以從中讀入一個字節序列的對象被稱為輸入流;能夠向其寫入一個字節序列的物件被稱為輸出流。

2. 位元組流

    Java中的位元組流處理的最基本單位為單一位元組,它通常用來處理二進位資料。 Java中最基本的兩個位元組流類別是InputStream和OutputStream,它們分別代表了群組基本的輸入位元組流和輸出位元組流。 InputStream類別與OutputStream類別都是抽象類別,我們在實際使用中通常使用Java類別庫中提供的它們的一系列子類別。下面我們以InputStream類別為例,來介紹下Java中的位元組流

    InputStream類別中定義了一個基本的用於從位元組流中讀取位元組的方法read,這個方法的定義如下:

public abstract int read() throws IOException;

    這是一個抽象方法,也就是說任何派生自InputStream的輸入位元組流類別都需要實現這個方法,這方法的功能是從位元組流中讀取一個字節,若到了結尾則回傳-1,否則回傳讀入的位元組。關於這個方法我們需要注意的是,它會一直阻塞知道傳回一個讀取到的位元組或是-1。另外,位元組流在預設情況下是不支援快取的,這意味著每呼叫一次read方法都會請求作業系統來讀取一個位元組,這往往會伴隨著一次磁碟IO,因此效率會比較低。有的小夥伴可能認為InputStream類別中read的以位元組數組為參數的重載方法,能夠一次讀入多個位元組而不用頻繁的進行磁碟IO。那麼究竟是不是這樣呢?我們來看看這個方法的原始碼:

public int read(byte b[]) throws IOException {
  return read(b, 0, b.length);
}

    它呼叫了另一個版本的read重載方法,那我們就接著往下追:

   public int read(byte b[], int off, int len) throws IOException {
    if (b == null) {
      throw new NullPointerException();
    } else if (off < 0 || len < 0 || len > b.length - off) {
      throw new IndexOutOfBoundsException();
    } else if (len == 0) {
      return 0;
    }

    int c = read();
    if (c == -1) {
      return -1;
    }
    b[off] = (byte)c;

    int i = 1;
    try {
      for (; i < len ; i++) {
        c = read();
        if (c == -1) {
          break;
        }
        b[off + i] = (byte)c;
      }
    } catch (IOException ee) {
    }
    return i;
  }

    從以上的程式碼我們可以看到,實際上read(byte[])方法內部也是透過循環呼叫read()方法來實現「一次」讀入一個位元組數組的,因此本質來說這個方法也未使用記憶體緩衝區。要使用記憶體緩衝區以提高讀取的效率,我們應該使用BufferedInputStream。

3. 字元流

    Java中的字元流處理的最基本的單元是Unicode碼元(大小2位元組),它通常用來處理文本數據。所謂Unicode碼元,也就是一個Unicode代碼單元,範圍是0x0000~0xFFFF。在以上範圍內的每個數字都與一個字元相對應,Java中的String類型預設就把字元以Unicode規則編碼而後儲存在記憶體中。然而與儲存在記憶體中不同,儲存在磁碟上的資料通常有著各種各樣的編碼方式。使用不同的編碼方式,相同的字元會有不同的二進位表示。實際上字元流是這樣運作的:

  1. 輸出字元流:把要寫入檔案的字元序列(實際上是Unicode碼元序列)轉為指定編碼方式下的字節序列,然後再寫入到檔案中;

  2. 輸入字元流:把要讀取的位元組序列以指定編碼方式解碼為對應字元序列(實際上是Unicode碼元序列從)從而可以存在記憶體中。

    我們透過一個demo來加深對這個過程的理解,範例程式碼如下:

import java.io.FileWriter;
import java.io.IOException;


public class FileWriterDemo {
  public static void main(String[] args) {
    FileWriter fileWriter = null;
    try {
      try {
        fileWriter = new FileWriter("demo.txt");
        fileWriter.write("demo");
      } finally {
        fileWriter.close();
      }
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}

    以上程式碼中,我們使用FileWriter向demo.txt中寫入了「demo」這四個字符,我們用十六進位編輯器WinHex查看下demo.txt的內容:

##從上圖可以看出,我們寫入的“demo”被編碼為了“64 65 6D 6F”,但是我們並沒有在上面的代碼中顯式指定編碼方式,實際上,在我們沒有指定時使用的是作業系統的預設字元編碼方式來對我們要寫入的字元進行編碼。

    由於字元流在輸出前實際上是要完成Unicode碼元序列到對應編碼方式的位元組序列的轉換,所以它會使用記憶體緩衝區來存放轉換後得到的位元組序列,等待都轉換完畢再一同寫入磁碟檔案。

4. 字元流與位元組流的差異

    經過以上的描述,我們可以知道位元組流與字元流之間主要的差異體現在以下幾個方面:

  • 位元組流操作的基本單元為字節;字元流操作的基本單元為Unicode碼元。

  • 位元組流預設不使用緩衝區;字元流使用緩衝區。

  • 位元組流通常用於處理二進位數據,實際上它可以處理任意類型的數據,但它不支援直接寫入或讀取Unicode碼元;字元流通常處理文本數據,它支援寫入及讀取Unicode碼元。

#

以上是Java中字符流與位元組流的區別詳細介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn