1. 개요
이 튜토리얼에서는 Java를 사용하여 대용량 파일을 효율적으로 읽는 방법을 보여줍니다. 이 기사는 Baeldung(http://www.baeldung.com/)의 "Java - Back to Basics" 튜토리얼 시리즈의 일부입니다.
2. 메모리에서 읽기
파일 줄을 읽는 표준 방법은 메모리에서 읽는 것입니다. Guava와 Apache Commons IO는 모두 아래와 같이 파일 줄을 읽는 빠른 방법을 제공합니다.
Files.readLines(new File(path), Charsets.UTF_8); FileUtils.readLines(new File(path));
이 방법의 문제점은 파일의 모든 행이 메모리에 저장된다는 것입니다. 파일이 충분히 크면 프로그램에서 곧 OutOfMemoryError 예외가 발생하게 됩니다.
예: 약 1G의 파일 읽기:
@Test public void givenUsingGuava_whenIteratingAFile_thenWorks() throws IOException { String path = ... Files.readLines(new File(path), Charsets.UTF_8); }
이 방법은 처음에는 메모리를 거의 차지하지 않습니다. (약 0Mb의 메모리가 소비됩니다)
[main] INFO org.baeldung.java.CoreJavaIoUnitTest - Total Memory: 128 Mb [main] INFO org.baeldung.java.CoreJavaIoUnitTest - Free Memory: 116 Mb
그러나 모든 파일을 메모리로 읽어들이면 마침내 확인할 수 있습니다(약 2GB의 메모리가 소비됨).
[main] INFO org.baeldung.java.CoreJavaIoUnitTest - Total Memory: 2666 Mb [main] INFO org.baeldung.java.CoreJavaIoUnitTest - Free Memory: 490 Mb
이는 이 프로세스가 약 2.1GB의 메모리를 소비한다는 것을 의미합니다. 이유는 간단합니다. 이제 파일의 모든 줄이 메모리에 저장됩니다.
파일의 전체 내용을 메모리에 넣으면 사용 가능한 메모리가 빠르게 소진됩니다. 실제로 사용 가능한 메모리의 양에 관계없이 이는 명백합니다.
또한 일반적으로 파일의 모든 줄을 한 번에 메모리에 넣을 필요는 없습니다. 대신 파일의 각 줄을 반복하고 적절한 처리를 수행한 후 버리면 됩니다. 처리 후. 이것이 바로 우리가 하려는 일입니다. 모든 행을 메모리에 보관하는 대신 행 전체를 반복하는 것입니다.
3. 파일 스트림
이제 이 솔루션을 살펴보겠습니다. java.util.Scanner 클래스를 사용하여 파일 내용을 스캔하고 한 줄씩 계속해서 읽습니다.
FileInputStream inputStream = null; Scanner sc = null; try { inputStream = new FileInputStream(path); sc = new Scanner(inputStream, "UTF-8"); while (sc.hasNextLine()) { String line = sc.nextLine(); // System.out.println(line); } // note that Scanner suppresses exceptions if (sc.ioException() != null) { throw sc.ioException(); } } finally { if (inputStream != null) { inputStream.close(); } if (sc != null) { sc.close(); } }
이 방식은 파일의 모든 줄을 반복하므로 각 줄을 참조하지 않고도 처리할 수 있습니다. 즉, 메모리에 저장되지 않습니다. (약 150MB의 메모리가 소모됩니다.)
[main] INFO org.baeldung.java.CoreJavaIoUnitTest - Total Memory: 763 Mb [main] INFO org.baeldung.java.CoreJavaIoUnitTest - Free Memory: 605 Mb
4. Apache Commons IO 스트림
또한 다음을 제공하는 Commons IO 라이브러리를 사용할 수도 있습니다. 사용자 정의 LineIterator:
LineIterator it = FileUtils.lineIterator(theFile, "UTF-8"); try { while (it.hasNext()) { String line = it.nextLine(); // do something with line } } finally { LineIterator.closeQuietly(it); }
전체 파일이 메모리에 저장되지 않으므로 매우 보수적인 메모리 소비가 발생합니다. (약 150MB의 메모리 소비)
[main] INFO o.b.java.CoreJavaIoIntegrationTest - Total Memory: 752 Mb [main] INFO o.b.java.CoreJavaIoIntegrationTest - Free Memory: 564 Mb

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于结构化数据处理开源库SPL的相关问题,下面就一起来看一下java下理想的结构化数据处理类库,希望对大家有帮助。

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于PriorityQueue优先级队列的相关知识,Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于java锁的相关问题,包括了独占锁、悲观锁、乐观锁、共享锁等等内容,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于多线程的相关问题,包括了线程安装、线程加锁与线程不安全的原因、线程安全的标准类等等内容,希望对大家有帮助。

本篇文章给大家带来了关于Java的相关知识,其中主要介绍了关于关键字中this和super的相关问题,以及他们的一些区别,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于枚举的相关问题,包括了枚举的基本操作、集合类对枚举的支持等等内容,下面一起来看一下,希望对大家有帮助。

封装是一种信息隐藏技术,是指一种将抽象性函式接口的实现细节部分包装、隐藏起来的方法;封装可以被认为是一个保护屏障,防止指定类的代码和数据被外部类定义的代码随机访问。封装可以通过关键字private,protected和public实现。

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于设计模式的相关问题,主要将装饰器模式的相关内容,指在不改变现有对象结构的情况下,动态地给该对象增加一些职责的模式,希望对大家有帮助。


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

ZendStudio 13.5.1 맥
강력한 PHP 통합 개발 환경

SublimeText3 영어 버전
권장 사항: Win 버전, 코드 프롬프트 지원!

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구
