JavaScript는 문자열을 처리하는 데는 매우 능숙하지만 원래 HTML 문서를 처리하도록 설계되었기 때문에 바이너리 데이터를 처리하는 데는 그다지 능숙하지 않습니다. JavaScript에는 바이트 유형, 구조화된 유형, 심지어 바이트 배열도 없고 숫자와 문자열만 있습니다. (원본 텍스트: JavaScript에는 바이트 유형이 없습니다. 숫자만 있습니다. 또는 구조화된 유형 또는 http://skylitecellars.com/ 심지어 바이트 배열도 있습니다. 단지 문자열만 있습니다.)
Node는 JavaScript를 기반으로 하면 HTTP와 같은 텍스트 프로토콜을 자연스럽게 처리할 수 있지만 이를 사용하여 데이터베이스와 상호 작용하고 이미지나 파일 업로드 등을 처리할 수도 있습니다. 문자열만 사용하여 이러한 작업을 수행하는 것이 얼마나 어려울지 상상할 수 있습니다. 이전에 Node는 바이트를 텍스트 문자로 인코딩하여 이진 데이터를 처리했지만 나중에 이 접근 방식은 실행 불가능하고 리소스가 낭비되며 느리고 유연성이 없으며 유지 관리가 어렵다는 것이 입증되었습니다.
노드에는 바이너리 버퍼 구현 Buffer가 있습니다. 이 의사 클래스는 바이너리 데이터 처리를 위한 일련의 API를 제공하여 바이너리 데이터 처리가 필요한 작업을 단순화합니다. 버퍼의 길이는 바이트 데이터의 길이에 따라 결정되며, 버퍼에 바이트 데이터를 임의로 설정하고 가져올 수 있습니다.
참고: Buffer 클래스에는 특별한 점이 있습니다. 버퍼의 바이트 데이터가 차지하는 메모리는 JavaScrp
It VM 메모리 힙에 할당되지 않습니다. JavaScript의 가비지 수집 알고리즘에 의해 처리되지 않고 수정되지 않는 영구 메모리 주소로 대체되므로 버퍼 내용의 메모리 복사로 인한 CPU 낭비도 방지됩니다.
버퍼 생성
다음과 같이 UTF-8 문자열로 버퍼를 생성할 수 있습니다.
var buf = new Buffer(‘Hello World!');
지정된 인코딩의 문자열로 버퍼를 생성할 수도 있습니다.
var buf = new Buffer('8b76fde713ce', 'base64');
허용되는 문자 인코딩 및 식별자는 다음과 같습니다.
1.ascii - ASCI, ASCII 문자 집합에만 적용 가능합니다.
2.utf8 - UTF-8, 이 가변 너비 인코딩은 유니코드 문자 집합의 모든 문자에 적합합니다. 이는 웹 세계에서 선호되는 인코딩이 되었으며 Node.js의 기본 인코딩 유형이기도 합니다.
3.base64——Base64, 이 인코딩은 이진 데이터를 표현하기 위해 인쇄 가능한 ASCII 문자 64개를 기반으로 합니다. Base64는 일반적으로 문자열로 변환할 수 있고 필요할 때 완전하게 다시 변환할 수 있는 이진 데이터를 포함하는 데 사용됩니다. 원래 바이너리 형식으로.
버퍼를 초기화할 데이터가 없으면 지정된 용량의 빈 버퍼를 생성할 수 있습니다.
var buf = new Buffer(1024); // 创建一个1024字节的缓冲
버퍼 데이터 가져오기 및 설정
버퍼를 생성하거나 받은 후 버퍼 객체의 내용을 보거나 수정할 수 있습니다. [] 연산자를 통해 버퍼의 특정 바이트에 액세스할 수 있습니다.
var buf = new Buffer('my buffer content'); // 访问缓冲内第10个字节 console.log(buf[10]); // -> 99
참고: 초기화된 버퍼를 생성할 때(버퍼 용량 크기 사용) 이때 버퍼링된 데이터는 0으로 초기화되지 않고 랜덤 데이터라는 점에 유의하시기 바랍니다.
var buf = new Buffer(1024); console.log(buf[100]); // -> 5 (某个随机值)
다음과 같이 버퍼의 어느 위치에서나 데이터를 수정할 수 있습니다.
buf[99] = 125; // 把第100个字节的值设置为125
참고: 경우에 따라 다음과 같은 일부 버퍼 작업으로 인해 오류가 발생하지 않습니다.
1. 버퍼의 최대 바이트 값은 255입니다. 바이트에 256보다 큰 숫자가 할당되면 모듈로 256이 되고 결과는 이 바이트에 할당됩니다.
2. 버퍼의 특정 바이트에 256 값이 할당되면 실제 값은 0이 됩니다. (번역자 주: 실제로 첫 번째 바이트와 반복됨, 256%256=0)
3. 부동 소수점 숫자는 100.7과 같이 버퍼의 특정 바이트에 값을 할당합니다. 실제 값은 부동 소수점 숫자의 정수 부분(100
4)이 됩니다. 버퍼 용량이 부족하면 할당 작업이 실패합니다. 버퍼는 어떤 방식으로도 수정되지 않습니다.
길이 속성을 사용하여 버퍼 길이를 얻을 수 있습니다:
var buf = new Buffer(100); console.log(buf.length); // -> 100
또한 버퍼 길이를 사용하여 버퍼 내용을 반복하여 각 바이트를 읽거나 설정할 수도 있습니다.
var buf = new Buffer(100); for(var i = 0; i < buf.length; i++) { buf[i] = i; }
위 코드는 100바이트를 포함하는 새 버퍼를 생성하고 버퍼의 각 바이트를 0에서 99로 설정합니다.
버퍼 데이터 분할
버퍼를 생성하거나 수신하면 버퍼 데이터의 일부를 추출해야 할 수 있습니다. 시작 위치를 지정하여 기존 버퍼를 분할하여 더 작은 버퍼를 생성할 수 있습니다. buffer:
var buffer = new Buffer("this is the content of my buffer"); var smallerBuffer = buffer.slice(8, 19); console.log(smallerBuffer.toString()); // -> "the content"
버퍼를 분할할 때 새 메모리가 할당되거나 복사되지 않습니다. 새 버퍼는 부모 버퍼의 특정 데이터 부분인 부모 버퍼의 메모리를 사용합니다. 위치). 이 구절은 여러 가지 의미를 담고 있습니다.
우선, 프로그램이 상위 버퍼의 내용을 수정하는 경우 이러한 수정 사항은 관련 하위 버퍼에도 영향을 미칩니다. 상위 버퍼와 하위 버퍼는 서로 다른 JavaScript 객체이므로 무시하기 쉽습니다. 이 문제로 인해 잠재적인 버그가 발생할 수 있습니다.
둘째, 이러한 방식으로 상위 버퍼에서 더 작은 하위 버퍼를 생성하면 작업이 완료된 후에도 상위 버퍼 개체는 계속 유지되며 주의를 기울이지 않으면 가비지 수집되지 않습니다. , 메모리 누수가 발생하기 쉽습니다.
참고: 메모리 누수가 걱정된다면 아래에서 설명하는 복사 작업 대신 복사 방법을 사용할 수 있습니다.
버퍼 데이터 복사
다음과 같이 copy를 사용하여 버퍼의 일부를 다른 버퍼에 복사할 수 있습니다.
var buffer1 = new Buffer("this is the content of my buffer"); var buffer2 = new Buffer(11); var targetStart = 0; var sourceStart = 8; var sourceEnd = 19; buffer1.copy(buffer2, targetStart, sourceStart, sourceEnd); console.log(buffer2.toString()); // -> "the content"
위 코드는 소스의 9~20번째 데이터를 복사합니다. buffer 대상 버퍼의 시작 부분까지의 바이트입니다.
버퍼 데이터 디코딩
버퍼 데이터는 다음과 같이 UTF-8 문자열로 변환될 수 있습니다.
var str = buf.toString();
还可以通过指定编码类型来将缓冲数据解码成任何编码类型的数据。比如,你想把一个缓冲解码成base64字符串,可以这么做:
var b64Str = buf.toString("base64");
使用toString函数,你还可以把一个UTF-8字符串转码成base64字符串:
var utf8String = 'my string'; var buf = new Buffer(utf8String); var base64String = buf.toString('base64')
小结
有时候,你不得不跟二进制数据打交道,但是原生JavaScript又没有明确的方式来做这件事,于是Node提供了Buffer类,封装了一些针对连续内存块的操作。你可以在两个缓冲之间切分或复制内存数据。
你也可以把一个缓冲转换成某种编码的字符串,或者反过来,把一个字符串转化成缓冲,来访问或处理每个bit。
更多Node.js中使用Buffer编码、解码二进制数据详解相关文章请关注PHP中文网!