>  기사  >  Java  >  Java의 문자 스트림과 바이트 스트림의 차이점에 대한 자세한 소개

Java의 문자 스트림과 바이트 스트림의 차이점에 대한 자세한 소개

黄舟
黄舟원래의
2017-03-25 10:33:322310검색

이 글에서는 Java에서 문자 스트림과 바이트 스트림의 차이점을 설명하는 관련 정보를 주로 소개합니다. 필요한 친구는

Java에서 문자 스트림과 바이트 스트림의 차이점

1. 스트림이란

Java의 스트림은 바이트 시퀀스의 추상화이지만 이제는 물 파이프로 흐릅니다. 수도관 그 안에 들어 있는 것은 더 이상 물이 아니라 일련의 바이트입니다. 물 흐름과 마찬가지로 Java의 스트림에도 "흐름 방향"이 있습니다. 일반적으로 바이트 시퀀스를 읽을 수 있는

객체를 입력 스트림이라고 합니다. 입력 스트림. 객체를 출력 스트림이라고 합니다.

2. 바이트 스트림

Java에서 바이트 스트림 처리의 가장 기본 단위는 단일 바이트로, 일반적으로 바이너리 데이터를 처리하는 데 사용됩니다. Java에서 가장 기본적인 두 가지 바이트 스트림 클래스는 각각 기본 입력 바이트 스트림과 출력 바이트 스트림을 나타내는 InputStream 및 OutputStream입니다. InputStream 클래스와 OutputStream 클래스는 모두

추상 클래스

입니다. 실제 사용에서는 일반적으로 Java클래스 라이브러리에서 제공되는 일련의 하위 클래스를 사용합니다. Java에서 바이트 스트림을 소개하기 위해 InputStream 클래스를 예로 들어보겠습니다. InputStream 클래스는 바이트 스트림에서 바이트를 읽는 기본 메소드를 정의합니다. 이 메소드의 정의는 다음과 같습니다.

public abstract int read() throws IOException;

이는 추상 메소드입니다. 즉, InputStream에서 파생된 모든 입력 바이트 스트림 클래스가 이 메소드를 구현해야 함을 의미합니다. 이 메소드의 기능은 끝에 도달하면 바이트 스트림 섹션에서 단어를 읽는 것입니다. 그렇지 않으면 읽은 바이트가 반환됩니다. 이 메서드에 대해 주의해야 할 점은 읽기 바이트 또는 -1을 반환할 때까지 차단된다는 것입니다. 또한 바이트 스트림은 기본적으로 캐싱을 지원하지 않습니다. 즉, 읽기 메서드가 호출될 때마다 운영 체제에 바이트 읽기를 요청하는데, 이는 종종 디스크 IO를 동반하므로 효율성이 상대적으로 낮습니다. 어떤 친구들은 바이트 배열을 매개변수로 취하는 InputStream 클래스의 오버로드된 읽기 메소드가 빈번한 디스크 IO 없이 한 번에 여러 바이트를 읽을 수 있다고 생각할 수도 있습니다. 그렇다면 이것이 정말로 사실인가? 이 메소드의 소스 코드를 살펴보겠습니다.

public int read(byte b[]) throws IOException {
  return read(b, 0, b.length);
}

이는 읽기 오버로드 메소드의 다른 버전을 호출하므로 후속 조치를 취하겠습니다.

   public int read(byte b[], int off, int len) throws IOException {
    if (b == null) {
      throw new NullPointerException();
    } else if (off < 0 || len < 0 || len > b.length - off) {
      throw new IndexOutOfBoundsException();
    } else if (len == 0) {
      return 0;
    }

    int c = read();
    if (c == -1) {
      return -1;
    }
    b[off] = (byte)c;

    int i = 1;
    try {
      for (; i < len ; i++) {
        c = read();
        if (c == -1) {
          break;
        }
        b[off + i] = (byte)c;
      }
    } catch (IOException ee) {
    }
    return i;
  }

위 코드에서 예, 실제로 read(byte[]) 메서드는 루프에서 read() 메서드를 호출하여 "한 번에" 바이트 배열을 읽으므로 기본적으로 이 메서드는 메모리 버퍼를 사용하지 않습니다. 읽기 효율성을 높이기 위해 메모리 버퍼를 사용하려면 BufferedInputStream을 사용해야 합니다.

3. 문자 스트림

Java에서 문자 스트림 처리의 가장 기본적인 단위는 일반적으로 텍스트를 처리하는 데 사용되는 유니코드 코드 단위(크기 2바이트)입니다. 데이터. 소위 유니코드 코드 요소는 0x0000~0xFFFF 범위의 유니코드 코드 단위입니다. 위 범위의 각 숫자는 문자에 해당합니다. Java의

String

유형은 기본적으로 유니코드 규칙에 따라 문자를 인코딩한 후 메모리에 저장합니다. 그러나 메모리에 저장되는 것과 달리 디스크에 저장되는 데이터는 일반적으로 다양한 인코딩 방식을 가지고 있습니다. 다른 인코딩 방법을 사용하면 동일한 문자가 다른 이진 표현을 갖게 됩니다. 실제로 문자 스트림은 다음과 같이 작동합니다.

    출력 문자 스트림: 파일에 기록될 문자 시퀀스(실제로는 유니코드 코드 요소 시퀀스)를 지정된 인코딩의 문자로 변환합니다.
  1. 입력 문자

    스트림: 읽을 바이트 시퀀스를 지정된 문자열에 따라 해당 문자 시퀀스로 디코딩합니다. 메모리에 저장할 수 있도록 인코딩 방법(실제로는 유니코드 코드 요소의 시퀀스)입니다.

  2. 이 프로세스에 대한 이해를 돕기 위해 데모를 사용합니다.
import java.io.FileWriter;
import java.io.IOException;


public class FileWriterDemo {
  public static void main(String[] args) {
    FileWriter fileWriter = null;
    try {
      try {
        fileWriter = new FileWriter("demo.txt");
        fileWriter.write("demo");
      } finally {
        fileWriter.close();
      }
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}

위 코드에서는 FileWriter를 사용합니다. 데모.txt "demo"라는 4개의 문자가 기록되어 있으며 16진수

편집기

WinHex를 사용하여 데모.txt의 내용을 봅니다.

As 위 그림에서 볼 수 있듯이, 우리가 작성한 "demo"는 "64 65 6D 6F"로 인코딩되었지만 위 코드에서는 인코딩 방법을 명시적으로 지정하지 않았습니다. 실제로 지정하지 않았을 때는 인코딩 방법을 지정하지 않았습니다. 우리가 작성하려는 문자를 인코딩하는 데는 운영 체제의 기본 문자 인코딩이 사용되었습니다.

문자 스트림은 실제로 출력 전에 유니코드 코드 요소 시퀀스를 해당 인코딩 방법의 바이트 시퀀스로 변환해야 하므로 메모리 버퍼를 사용하여 변환된 바이트 시퀀스를 저장하고 그 후를 기다립니다. 변환이 완료되면 디스크 파일에 함께 기록됩니다.

4. 문자 스트림과 바이트 스트림의 차이점

위의 설명을 보면 바이트 스트림과 문자 스트림의 주요 차이점이 다음 측면에 반영되어 있음을 알 수 있습니다.

  • 바이트 스트림 연산의 기본 단위는 워드 섹션입니다. ; 문자 스트림 작업의 기본 단위는 유니코드 코드 요소입니다.

  • 바이트 스트림은 기본적으로 버퍼를 사용하지 않습니다.

  • 바이트 스트림은 일반적으로 이진 데이터를 처리하는 데 사용됩니다. 실제로 모든 유형의 데이터를 처리할 수 있지만 일반적으로 유니코드 코드 요소의 직접 쓰기 또는 읽기를 지원하지 않습니다. 유니코드 코드 요소 쓰기 및 읽기를 지원하는 데이터를 처리합니다.

위 내용은 Java의 문자 스트림과 바이트 스트림의 차이점에 대한 자세한 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.