찾다
웹 프론트엔드JS 튜토리얼Nodejs가 대용량 파일을 읽고 쓰는 방법에 대한 간략한 분석

Nodejs가 대용량 파일을 읽고 쓰는 방법에 대한 간략한 분석

저자는 최근 node 측에서 일부 파일 읽기, 쓰기 및 조각화된 업로드 작업을 수행하고 있습니다. 이 과정에서 노드에서 읽은 파일이 2G를 초과하고 최대 읽기 Blob을 초과하는 경우 읽기 예외가 발생합니다. 또한 노드에서 파일을 읽고 쓰는 것도 서버 RAM 제한 등의 영향을 받으며, 발생한 문제와 해결 방법을 기록해 두겠습니다. [추천 관련 튜토리얼: nodejs 동영상 튜토리얼]

  • 노드에서 파일 읽기 및 쓰기
  • 노드 파일 읽기 및 쓰기 RAM 및 Blob 크기 제한
  • Others

1. 노드에서 파일 읽기 및 쓰기

1.1 일반 파일 읽기 및 쓰기

정기적으로 상대적으로 작은 파일을 읽으려면 다음을 직접 전달할 수 있습니다.

const fs = require('fs')
let data = fs.readFileSync("./test.png")
console.log(data,123)
//输出data = <buffer></buffer>

일반적으로 js/nodejs는 단일이므로 동기화 방법은 그다지 권장되지 않습니다. 스레드 예, 동기화된 메서드는 기본 스레드를 차단합니다. 최신 버전의 노드는 async/await와 함께 직접 사용할 수 있는 fs.promise를 직접 제공합니다.

const fs = require('fs')
const readFileSync = async () => {
    let data = await fs.promises.readFile("./test.png")
    console.log(data,123)
}
readFileSync()
//输出data = <buffer></buffer>

여기서 비동기 메서드 호출은 메인 스레드를 차단하지 않으며 여러 파일 읽기의 IO도 다음에서 수행될 수 있습니다. 평행한.

1.2 스트림 파일 읽기 및 쓰기

기존 파일 읽기 및 쓰기의 경우 파일을 한 번에 메모리로 읽습니다. 이 방법은 시간 효율성이 매우 낮고 시간 효율성이 낮다는 의미입니다. done Once 후속 실행은 초기 읽기가 완료된 후에만 수행할 수 있습니다. 메모리 효율성이 낮다는 것은 파일을 한 번에 읽고 메모리에 넣어야 하므로 많은 메모리를 차지한다는 의미입니다. 따라서 이 경우 일반적으로 Stream을 사용하여 파일을 읽습니다.

const fs = require('fs')
const readFileTest = () => {
    var data = ''
    var rs = fs.createReadStream('./test.png');
    rs.on('data', function(chunk) {
        data += chunk;
        console.log(chunk)
     });
    rs.on('end',function(){
        console.log(data);
    });
    rs.on('error', function(err){
        console.log(err.stack);
     });
}
readFileTest()
// data = <buffer></buffer>

Steam을 통해 파일을 읽고 쓰는 것은 메모리 효율성과 시간 효율성을 향상시킬 수 있습니다.

  • 메모리 효율성: 대용량(또는 전체) 데이터를 처리하기 전에 메모리에 로드할 필요가 없습니다.
  • 시간 효율성: 데이터가 있으면 처리를 시작할 수 있으므로 처리 시작 시간이 크게 단축됩니다. 기다리지 않고 데이터 전체 데이터를 로드한 후 처리합니다.

스트림 파일은 두 번째 쓰기 방법도 지원합니다:

const fs = require('fs')
const readFileTest = () => {
    var data = ''
    var chunk;
    var rs = fs.createReadStream('./test.png');
    rs.on('readable', function() {
    while ((chunk=rs.read()) != null) {
        data += chunk;
    }});
    rs.on('end', function() {
        console.log(data)
    });
};
readFileTest()

2. 노드 파일 읽기 및 쓰기 RAM 및 Blob 크기의 제한

2.1 기본 문제

대용량 파일을 읽을 때 읽기 파일 크기가 있습니다. 예를 들어 현재 2.5G 비디오 파일을 읽고 있습니다.

const fs = require('fs')
const readFileTest = async () => {
    let data = await fs.promises.readFile("./video.mp4")
    console.log(data)
}
readFileTest()

위 코드를 실행하면 오류가 보고됩니다.

RangeError [ERR_FS_FILE_TOO_LARGE]: 파일 크기(2246121911)가 2GB보다 큽니다

제 생각에는 NODE_OPTIONS='--max-old-space-size=5000' 옵션을 설정하여 현재 5000M>2.5G로 설정했지만 오류는 여전히 사라지지 않았습니다. 이는 파일을 읽는 노드의 크기 제한을 변경할 수 없음을 의미합니다. 옵션을 통해.

위 내용은 대용량 파일을 읽는 일반적인 방법입니다. Steam으로 읽는 경우 파일 크기 제한이 있나요? 예:

const fs = require('fs')
const readFileTest = () => {
    var data = ''
    var rs = fs.createReadStream('./video.mp4');
    rs.on('data', function(chunk) {
        data += chunk;
     });
    rs.on('end',function(){
        console.log(data);
    });
    rs.on('error', function(err){
        console.log(err.stack);
     });
}
readFileTest()

위와 같은 방법으로 2.5G 파일을 읽어오면 예외는 없으나 여기서는 오류가 있으니 주의하세요:

data += chunk;
                ^

RangeError: Invalid string length

데이터 길이가 2048M 등 최대 한도를 초과했기 때문입니다. , 등. 따라서 Steam으로 처리할 때 판독 결과를 저장할 때 파일 크기에 주의하세요. 파일 크기는 버퍼의 기본 최대값을 초과하지 않아야 합니다. 위의 경우 모든 데이터를 대용량 데이터로 저장하기 위해 데이터 += 청크가 필요하지 않으며 동시에 읽고 처리할 수 있습니다.

2.2 세그먼트 읽기

파일을 읽는 동안 createReadStream은 실제로 세그먼트 단위로 읽을 수 있습니다. 이 세그먼트 읽기 방법은 대용량 파일을 읽는 대신 사용할 수도 있습니다. 특히 동시에 읽을 때 특정 장점이 있으며 파일 읽기 및 처리 속도를 향상시킬 수 있습니다.

CreateReadStream은 두 번째 매개변수인 {start, end}를 허용합니다. fs.promises.stat를 통해 파일 크기를 얻은 다음 조각을 결정하고 마지막 조각을 한 번에 읽을 수 있습니다. 예를 들어:

  1. Get the file size
const info = await fs.promises.stat(filepath)
   const size = info.size
  1. Fragment into the 지정된 SIZE( 예를 들어 조각당 128M Film)
  const SIZE = 128 * 1024 * 1024
  let sizeLen = Math.floor(size/SIZE)
    let total = sizeLen +1 ;
    for(let i=0;i<p>3. 읽기 기능을 구현합니다</p><pre class="brush:php;toolbar:false">const readStremfunc = () => {
    const readStream =  fs.createReadStream(filepath,{start:start,end:end})
    readStream.setEncoding('binary')
    let data = ''
    readStream.on('data', chunk => {
        data = data + chunk
    })
    readStream.end('data', () => {
      ...
    })
}

fs.createReadStream(filepath,{start,end}), 시작과 끝이 앞쪽에 닫히고 뒤쪽에 닫혀 있다는 점에 주목할 필요가 있습니다. 예를 들어 fs.createReadSteam(filepath,{ start:0,end:1023})은 [0,1023], 총 1024비트를 읽습니다.

3. 기타

3.1 브라우저 측에서 대용량 파일 읽기 및 쓰기 확장

이전에 nodejs에서 대용량 파일을 읽어본 적이 있는데, 브라우저 측에서 대용량 파일을 읽는 데 문제는 없나요?

    浏览器在本地读取大文件时,之前有类似FileSaver、StreamSaver等方案,不过在浏览器本身添加了File的规范,使得浏览器本身就默认和优化了Stream的读取。我们不需要做额外的工作,相关的工作:github.com/whatwg/fs。不过不同的版本会有兼容性的问题,我们还是可以通过FileSaver等进行兼容。

3.2 请求静态资源大文件

    如果是在浏览器中获取静态资源大文件,一般情况下只需要通过range分配请求即可,一般的CDN加速域名,不管是阿里云还是腾讯云,对于分片请求都支持的很好,我们可以将资源通过cdn加速,然后在浏览器端直接请求cdn加速有的资源。

    分片获取cdn静态资源大文件的步骤为,首先通过head请求获取文件大小:

const getHeaderInfo = async (url: string) => {
  const res: any = await axios.head(url + `?${Math.random()}`);
  return res?.headers;
};
const header = getHeaderInfo(source_url)
const size = header['content-length']

我们可以从header中的content-length属性中,获取文件的大小。然后进行分片和分段,最后发起range请求:

const getRangeInfo = async (url: string, start: number, end: number) => {
    const data = await axios({
      method: 'get',
      url,
      headers: {
        range: `bytes=${start}-${end}`,
      },
      responseType: 'blob',
    });
    return data?.data;
  };

在headers中指定 range: bytes=${start}-${end},就可以发起分片请求去获取分段资源,这里的start和end也是前闭后闭的。

更多node相关知识,请访问:nodejs 教程

위 내용은 Nodejs가 대용량 파일을 읽고 쓰는 방법에 대한 간략한 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
JavaScript 엔진 : 구현 비교JavaScript 엔진 : 구현 비교Apr 13, 2025 am 12:05 AM

각각의 엔진의 구현 원리 및 최적화 전략이 다르기 때문에 JavaScript 엔진은 JavaScript 코드를 구문 분석하고 실행할 때 다른 영향을 미칩니다. 1. 어휘 분석 : 소스 코드를 어휘 단위로 변환합니다. 2. 문법 분석 : 추상 구문 트리를 생성합니다. 3. 최적화 및 컴파일 : JIT 컴파일러를 통해 기계 코드를 생성합니다. 4. 실행 : 기계 코드를 실행하십시오. V8 엔진은 즉각적인 컴파일 및 숨겨진 클래스를 통해 최적화하여 Spidermonkey는 유형 추론 시스템을 사용하여 동일한 코드에서 성능이 다른 성능을 제공합니다.

브라우저 너머 : 실제 세계의 JavaScript브라우저 너머 : 실제 세계의 JavaScriptApr 12, 2025 am 12:06 AM

실제 세계에서 JavaScript의 응용 프로그램에는 서버 측 프로그래밍, 모바일 애플리케이션 개발 및 사물 인터넷 제어가 포함됩니다. 1. 서버 측 프로그래밍은 Node.js를 통해 실현되며 동시 요청 처리에 적합합니다. 2. 모바일 애플리케이션 개발은 재교육을 통해 수행되며 크로스 플랫폼 배포를 지원합니다. 3. Johnny-Five 라이브러리를 통한 IoT 장치 제어에 사용되며 하드웨어 상호 작용에 적합합니다.

Next.js (백엔드 통합)로 멀티 테넌트 SAAS 애플리케이션 구축Next.js (백엔드 통합)로 멀티 테넌트 SAAS 애플리케이션 구축Apr 11, 2025 am 08:23 AM

일상적인 기술 도구를 사용하여 기능적 다중 테넌트 SaaS 응용 프로그램 (Edtech 앱)을 구축했으며 동일한 작업을 수행 할 수 있습니다. 먼저, 다중 테넌트 SaaS 응용 프로그램은 무엇입니까? 멀티 테넌트 SAAS 응용 프로그램은 노래에서 여러 고객에게 서비스를 제공 할 수 있습니다.

Next.js (Frontend Integration)를 사용하여 멀티 테넌트 SaaS 응용 프로그램을 구축하는 방법Next.js (Frontend Integration)를 사용하여 멀티 테넌트 SaaS 응용 프로그램을 구축하는 방법Apr 11, 2025 am 08:22 AM

이 기사에서는 Contrim에 의해 확보 된 백엔드와의 프론트 엔드 통합을 보여 주며 Next.js를 사용하여 기능적인 Edtech SaaS 응용 프로그램을 구축합니다. Frontend는 UI 가시성을 제어하기 위해 사용자 권한을 가져오고 API가 역할 기반을 준수하도록합니다.

JavaScript : 웹 언어의 다양성 탐색JavaScript : 웹 언어의 다양성 탐색Apr 11, 2025 am 12:01 AM

JavaScript는 현대 웹 개발의 핵심 언어이며 다양성과 유연성에 널리 사용됩니다. 1) 프론트 엔드 개발 : DOM 운영 및 최신 프레임 워크 (예 : React, Vue.js, Angular)를 통해 동적 웹 페이지 및 단일 페이지 응용 프로그램을 구축합니다. 2) 서버 측 개발 : Node.js는 비 차단 I/O 모델을 사용하여 높은 동시성 및 실시간 응용 프로그램을 처리합니다. 3) 모바일 및 데스크탑 애플리케이션 개발 : 크로스 플랫폼 개발은 개발 효율을 향상시키기 위해 반응 및 전자를 통해 실현됩니다.

JavaScript의 진화 : 현재 동향과 미래 전망JavaScript의 진화 : 현재 동향과 미래 전망Apr 10, 2025 am 09:33 AM

JavaScript의 최신 트렌드에는 Typescript의 Rise, 현대 프레임 워크 및 라이브러리의 인기 및 WebAssembly의 적용이 포함됩니다. 향후 전망은보다 강력한 유형 시스템, 서버 측 JavaScript 개발, 인공 지능 및 기계 학습의 확장, IoT 및 Edge 컴퓨팅의 잠재력을 포함합니다.

Demystifying JavaScript : 그것이하는 일과 중요한 이유Demystifying JavaScript : 그것이하는 일과 중요한 이유Apr 09, 2025 am 12:07 AM

JavaScript는 현대 웹 개발의 초석이며 주요 기능에는 이벤트 중심 프로그래밍, 동적 컨텐츠 생성 및 비동기 프로그래밍이 포함됩니다. 1) 이벤트 중심 프로그래밍을 사용하면 사용자 작업에 따라 웹 페이지가 동적으로 변경 될 수 있습니다. 2) 동적 컨텐츠 생성을 사용하면 조건에 따라 페이지 컨텐츠를 조정할 수 있습니다. 3) 비동기 프로그래밍은 사용자 인터페이스가 차단되지 않도록합니다. JavaScript는 웹 상호 작용, 단일 페이지 응용 프로그램 및 서버 측 개발에 널리 사용되며 사용자 경험 및 크로스 플랫폼 개발의 유연성을 크게 향상시킵니다.

Python 또는 JavaScript가 더 좋습니까?Python 또는 JavaScript가 더 좋습니까?Apr 06, 2025 am 12:14 AM

Python은 데이터 과학 및 기계 학습에 더 적합한 반면 JavaScript는 프론트 엔드 및 풀 스택 개발에 더 적합합니다. 1. Python은 간결한 구문 및 풍부한 라이브러리 생태계로 유명하며 데이터 분석 및 웹 개발에 적합합니다. 2. JavaScript는 프론트 엔드 개발의 핵심입니다. Node.js는 서버 측 프로그래밍을 지원하며 풀 스택 개발에 적합합니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

안전한 시험 브라우저

안전한 시험 브라우저

안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구