首頁  >  文章  >  web前端  >  淺析Node.js中的Buffer,聊聊事件循環

淺析Node.js中的Buffer,聊聊事件循環

青灯夜游
青灯夜游轉載
2022-05-18 20:30:462571瀏覽

這篇文章帶大家了解一下Node中的Buffer,並聊聊瀏覽器的事件循環,希望對大家有幫助!

淺析Node.js中的Buffer,聊聊事件循環

Buffer 的使用



  • #資料的二進位

  • 電腦中所有的內容:文字、數字、圖片、音訊、視訊最終都會使用二進位來表示

    • JS可以直接去處理非常直覺的資料:例如字串,我們通常展示給使用者的也是這些內容
    • 但你可能會以為JS也能夠處理圖片
    事實上在網頁端,圖片一直是交給瀏覽器來處理的
  • JS

      HTML
    • ,只是負責告訴瀏覽器圖片的地址
    • 瀏覽器負責發送請求獲取這個圖片,並且最終將這個圖片給渲染出來
    • 但是對於服務端來說是不一樣的
    • 服務端要處理的本機檔案類型相對較多例如某一個儲存文字的檔案並不是使用
    • utf-8
    • 進行編碼的,而是用GBK,那麼我們必須讀取到他們的二進位數據,再透過GKB轉換成對應的文字例如我們需要讀取的是一張圖片資料(二進位),再透過某些手段對圖片資料進行二次的處理(裁切、格式轉換、旋轉、新增濾鏡),Node有一個名為
    • sharp
    的函式庫,就是負責讀取圖片或是傳入圖片的
  • Buffer
對其再處理的

#例如在Node#中透過TCP

建立長連接,TCP傳輸的是位元組流,我們需要將資料轉成位元組再進行傳入,並且需要知道傳輸位元組的大小(客戶端需要根據大小來判斷讀取多少內容)
  • Buffer和二進位

  • #我們會發現,對於前端開發來說,通常很少會和二進制打交道,但是對於伺服器端來說,為了實現很多功能,我們必須直接去操作其二進制的資料
    • 所以
    • Node
    • 為了可以方便開發者完成更多功能,提供給了我們一個名為
    • Buffer的類,並且他是全局的
    • 我們前面說過,Buffer中存儲的是二進位數據,那麼到底是如何儲存的呢?
我們可以將Buffer看成是一個儲存二進位的陣列
  • 這個陣列中的每一項,可以保存

    8

    位元二進位:
      00000000
    • ,剛好是一個位元組
    • 為什麼是8位元呢? 在電腦中,很少的情況我們會直接操作一位二進制,因為一位二進位儲存的資料是非常有限的所以通常會將8位元合在一起作為一個單元,這個單元稱為一個位元組(byte
    • 也就是說1 byte = 8 bit1kb = 1024 byte 1M = 1024kb1 G = 1024 M
    • 例如許多程式語言中的int類型是
    • 4
    • 個字節,long類型是8個位元組
    #例如
  • TCP
傳輸的是位元組流,在寫入和讀取時都需要說明位元組的個數

例如RGB的值分別都是255

,所以本質上在電腦中都是用一個字節儲存的
  • Buffer與字串
    • Buffer
    • 相當於是一個位元組的數組,數組中的每一項對於一個位元組的大小
  • 如果我們希望將一個字串放入到Buffer中,是怎麼樣的過程呢?

將字串直接傳入Buffer類別中,然後再建立buffer實例

英文字串有個特點,每個字元對應一個位元組的二進位編碼
  • const message = 'Hello'
    // 使用new关键字创建buffer实例,但这种创建方法已经过期了
    const buffer = new Buffer(message)
    console.log(buffer); // <Buffer 48 65 6c 6c 6f>
    console.log(buffer.toString()); // Hello
    中文字串的編解碼
  • buffer
的預設編碼是
    utf-8
  • ,所以在下列程式碼中,

    Buffer

    類別是使用了utf-8編碼對我們的字串進行編碼,使用的也是utf -8對我們的字串進行解碼
    • 中文字串有個特點,在utf-8編碼中,一個文字對應
    • 3
    個位元組的二進位編碼
const message = &#39;你好啊&#39;
// 使用Buffer.from对我们的字符串进行解码
const buffer = Buffer.from(message)
console.log(buffer); // <Buffer e4 bd a0 e5 a5 bd e5 95 8a>
// buffer实例中有个toString方法可以对编码进行解码
console.log(buffer.toString()); // &#39;你好啊&#39;

那如果編碼和解碼用的是不同形式的編碼結果會怎麼樣呢?

毫無疑問,解碼出來的東西並不是我們原先編碼的字串

#<pre class="brush:js;toolbar:false;">const message = &amp;#39;你好啊&amp;#39; const buffer = Buffer.from(message, &amp;#39;utf16le&amp;#39;) console.log(buffer); // &lt;Buffer 60 4f 7d 59 4a 55&gt; console.log(buffer.toString()); // `O}YJU</pre>Buffer的其他建立方式

#########建立###buffer###的方式有很多,我們這裡可以透過###alloc###的方式來建立###Buffer##### #
  • 我们可以直接对buffer实例以数组的形式对每一位进行修改

    • 如果修改的是一个十进制数字,那它会自动帮助我们转化成16进制的数字
    • 如果修改的是一个十六进制数字,那么就会直接写入
// 其可以指定我们buffer的位数,比如这里传递进去的是8,那么创建出来的buffer就有8个元素,且每个元素对应的二进制数都是0
const buffer = Buffer.alloc(8)
console.log(buffer); // <Buffer 00 00 00 00 00 00 00 00>
// 赋值为十进制数字的话,buffer会帮我们转化为16进制数字再写入到对应的位置
buffer[0] = 88 
// 在js中,以0x开头的就表示为16进制的数字
buffer[1] = 0x88
console.log(buffer); // <Buffer 58 88 00 00 00 00 00 00>

Buffer和文件操作

1、文本文件

  • 如果未指定字符编码,则不进行解码,直接返回原始的 buffer,也就是文件内容结果utf-8编码后的二进制数
const fs = require(&#39;fs&#39;)
fs.readFile(&#39;./a.txt&#39;, (err, data) => {
  console.log(data); // <Buffer e5 93 88 e5 93 88>
})
  • 编码和解码用的都是utf-8,则可以得到文件中正确的内容
const fs = require(&#39;fs&#39;)
// encoding表示解码所用的字符编码,编码默认为utf-8
fs.readFile(&#39;./a.txt&#39;, { encoding: &#39;utf-8&#39; }, (err, data) => {
  console.log(data); // 哈哈
})
  • 如果编码和解码所用的字符编码不同,则最终读取出来的内容会乱码
const fs = require(&#39;fs&#39;)
// 编码用的是utf16le字符编码,解码使用的是utf-8格式,肯定是解不是正确的内容的
fs.readFile(&#39;./a.txt&#39;, { encoding: &#39;utf16le&#39; }, (err, data) => {
  console.log(data); // 鏥袓
})
// 以上代码和下面代码类似
const msg = &#39;哈哈&#39;
const buffer = Buffer.from(msg, &#39;utf-8&#39;)
console.log(buffer.toString(&#39;utf16le&#39;)); // 鏥袓

2、图片文件

  • 对图片编码进行拷贝,达到复制图片的目的

    • 读取图片的时候不要指定encoding属性,因为字符编码只有在读取文本文件的时候才有用
const fs = require(&#39;fs&#39;)

fs.readFile(&#39;./logo.png&#39;, (err, data) => {
  console.log(data); // 打印出来的是图片文件对应的二进制编码
  
  // 我们还可以将图片编码写入到另一个文件当中,相当于我们将该图片拷贝了一份
  fs.writeFile(&#39;./bar.png&#39;, data, err => {
    console.log(err); 
  })
})
  • 对图片进行翻转、裁剪等操作,可以使用sharp这个库
const sharp = require(&#39;sharp&#39;)

// 将logo.png这张图片裁剪成200x300后拷贝到文件bax.png中
sharp(&#39;./logo.png&#39;)
  .resize(200, 300)
  .toFile(&#39;./bax.png&#39;, (err, info) => {
    console.log(err);
  })

// 还可以将图片文件先转为buffer,然后在写入到文件中,也可以实现拷贝图片的目的
sharp(&#39;./logo.png&#39;)
  .resize(300, 300)
  .toBuffer()
  .then(data => {
    fs.writeFile(&#39;./baa.png&#39;, data, err => {
      console.log(err);
    })
  })

Buffer的创建过程

  • 事实上我们创建Buffer时,并不会频繁的向操作系统申请内存,它会默认先申请一个8 * 1024 个字节大小的内存,也就是8kb
  • 等到内存不够或者快用完的时候才会去申请新的内存

事件循环和异步IO


什么是事件循环?

  • 事件循环是什么?

    • 事实上我把事件循环理解成我们编写的JS和浏览器或者Node之间的一个桥梁
  • 浏览器的事件循环是一个我们编写的JS代码和浏览器API调用(setTimeoutAJAX监听事件等)的一个桥梁,桥梁之间通过回调函数进行沟通
  • Node的事件循环是一个我们编写的JS代码和系统调用(file systemnetwor等)之间的一个桥梁,,桥梁之间也是通过回调函数进行沟通的

淺析Node.js中的Buffer,聊聊事件循環

进程和线程

进程和线程是操作系统中的两个概念:

  • 进程(process):计算机已经运行的程序
  • 线程(thread):操作系统能够运行运算调度的最小单位,所以CPU能够直接操作线程

听起来很抽象,我们直观一点解释:

  • 进程:我们可以认为,启动一个应用程序,就会默认启动一个进程(也可能是多个进程)
  • 线程:每一个进程中,都会启动一个线程用来执行程序中的代码,这个线程被称之为主线程
  • 所以我们也可以说进程是线程的容器

再用一个形象的例子解释

  • 操作系统类似于一个工厂
  • 工厂中有很多车间,这个车间就是进程
  • 每个车间可能有一个以上的工人在工厂,这个工人就是线程

多进程多线程开发

操作系统是如何做到同时让多个进程(边听歌、边写代码、边查阅资料)同时工作呢?

淺析Node.js中的Buffer,聊聊事件循環

  • 这是因为CPU的运算速度非常快,他可以快速的在多个进程之间迅速的切换
  • 当我们的进程中的线程获取到时间片时,就可以快速执行我们编写的代码
  • 对于用户来说是感受不到这种快速的切换的

淺析Node.js中的Buffer,聊聊事件循環

浏览器和JavaScript

  • 我们经常会说JavaScript是单线程的,但是JS的线程应该有自己的容器进程:浏览器或者Node

  • 浏览器是一个进程吗,它里面只有一个线程吗?

    • 目前多数的浏览器其实都是多进程的,当我们打开一个tab页面时就会开启一个新的进程,这是为了防止一个页面卡死而造成所有页面无法响应,整个浏览器需要强制退出
    • 每个进程中又有很多的线程,其中包括执行JavaScript代码的线程
  • 但是JavaScript的代码执行是在一个单独的线程中执行的

    • 这就意味着JS的代码,在同一时刻只能做一件事
    • 如果这件事是非常耗时的,就以为这当前的线程就会被阻塞

JavaScript的执行过程

函数要被压入函数调用栈中后才会被执行,下面我们来分析下代码的执行过程

const message = &#39;Hello World&#39;

console.log(message);

function sum(num1, num2) {
  return num1 + num2
}

function foo() {
  const result = sum(20, 30)
  console.log(result);
}

foo()
  • 我们JS的代码其实也可以像其它编程语言一样可以看成是在main函数中执行的
  • 那么首先我们要将main函数压入函数调用栈中
  • 定义变量message
  • 执行log函数,log函数会被放入到函数调用栈中,执行完后出栈
  • 调用foo函数,foo函数被压入函数调用栈中,但是执行过程中又需要调用sum函数
  • 所以sum函数会被压入到函数调用栈中,sum函数执行完毕后出栈
  • 此时foo函数也得到了sum函数返回的值,并执行了赋值操作,但又遇到了log函数
  • 所以又要将log函数压入到调用栈,log函数被执行完毕,出栈后foo函数也执行完毕,foo函数出栈
  • foo函数执行完后,整个js代码执行完毕,main函数出栈

浏览器的事件循环

如果在执行JS代码的过程中,有异步操作呢?

  • 比如中间我们插入了一个setTimeout的函数调用
  • 那么setTimeout这个函数被放入到调用栈中,执行会立即结束,并不会阻塞后续代码的执行

那么,往setTimeout函数里面传入的函数(我们称之为timer函数),会在什么时候被执行呢?

  • 事实上,setTimeout是调用了web api,浏览器会提前会将回调函数存储起来,在合适的时机,会将timer函数加入到一个事件队列中
  • 事件队列中的函数,会被放入到函数调用栈中,在调用栈中被执行

为什么setTimeout不会阻塞代码的执行呢?就是因为浏览器里面维护了一个非常非常重要的东西——事件循环

  • 浏览器中会通过某种方式帮助我们保存setTimeout中的回调函数的,比较常用的方法就是保存到一个红黑树里面

  • 等到setTimeout定时器时间到达的时候,它就会将我们的timer回调函数从保存的地方取出来并放入到事件队列里面

  • 事件循环一旦发现我们的队列中有东西了,并且当前函数调用栈是空的,其它同步代码也执行完之后,就会将我们队列中的回调函数依次出列放入到函数调用栈中执行(队列中前一个函数出栈后,下一个函数才会入栈)

当然事件队列中不一定只有一个事件,比如说在某个过程中用户点击了浏览器当中的某个按钮,我们可能对这个按钮的点击做了一个监听,对应了一个回调函数,那个回调函数也会被加入到我们的队列里面的,执行顺序按照它们在事件队列中的顺序执行。还有我们发送ajax请求的回调,也是加入到事件队列里面的

总结:其实事件循环是一个很简单的东西,它就是在某一个特殊的情况下,需要去执行某一个回调的时候,它就把提前保存好的回调塞入事件队列里面,事件循环再给它取出来放入到函数调用栈中

淺析Node.js中的Buffer,聊聊事件循環

宏任务与微任务

但是事件循环中并非只维护一个队列,事实上是有两个队列,而且队列中的任务执行一定会等到所有的script都执行完毕后

  • 宏任务队列(macrotask queue):ajaxsetTimeoutsetIntervalDOM监听、UI Rendering
  • 微任务队列(microtask queue):Promisethen回调、Mutation Observer APIqueueMicrotask()

那么事件循环对于两个队列的优先级是怎么样的呢?

  • main script中的代码优先执行(编写的顶层script代码)
  • 在执行任何一个宏任务之前(不是队列,是一个宏任务),都会先查看微任务队列中是否有任务需要执行
    • 也就是宏任务执行之前,必须保证微任务队列是空的
    • 如果不为空,那么就优先执行微任务队列中的任务(回调)

面试题

考点:main stciptsetTimeoutPromisethenqueueMicrotask

setTimeout(() => {
  console.log(&#39;set1&#39;);4
  new Promise(resolve => {
    resolve()
  }).then(resolve => {
    new Promise(resolve => {
      resolve()
    }).then(() => {
      console.log(&#39;then4&#39;);
    })
    console.log(&#39;then2&#39;);
  })
})

new Promise(resolve => {
  console.log(&#39;pr1&#39;);
  resolve()
}).then(() => {
  console.log(&#39;then1&#39;);
})

setTimeout(() => {
  console.log(&#39;set2&#39;);
})

console.log(2);

queueMicrotask(() => {
  console.log(&#39;queueMicrotask&#39;);
})

new Promise(resolve => {
  resolve()
}).then(() => {
  console.log(&#39;then3&#39;);
})

// pr1
// 2
// then1
// queueMicrotask
// then3
// set1
// then2
// then4
// set2
  • setTimeout会立即压入函数调用栈,执行完毕后立即出栈,其timer函数被放入到宏任务队列中

  • 传入Promise类的函数会被立即执行,其并不是回调函数,所以会打印出pr1,并且由于执行了resolve方法,所以该Promise的状态会立即变为fulfilled,这样then函数执行的时候其对应的回调函数就会被放入到微任务队列中

  • 又遇到了一个setTimeout函数,压栈出栈,其timer函数会被放入到宏任务队列中

  • 遇到console.log语句,函数压栈后执行打印出了2,然后出栈

  • 这里通过queueMicrotask绑定了个函数,该函数会被放入到微任务队列中

  • 又遇到了new Promise语句,但是其立即就将promise的状态改为了fulfilled,所以then函数对应的回调也被放入到了微任务队列中

  • 由于同步脚本代码已经执行完毕,现在事件循环开始要去把微任务队列和宏任务对垒的任务按照优先级顺序放入到函数调用栈中执行了,注意:微任务的优先级比宏任务高,每次想要执行宏任务之前都要看看微任务队列里面是否为空,不为空则需要先执行微任务队列的任务

  • 第一个微任务是打印then1,第二个微任务是打印queueMicrotask,第三个微任务是打印then3,执行完毕后,就开始去执行宏任务

  • 第一个宏任务比较复杂,首先会打印set1,然后执行了一个立即变换状态的new promise语句,其then回调会被放入到微任务队列中,注意现在微任务队列可不是空的,所以需要执行优先级较高的微任务队列,相当于该then回调被立即执行了,又是相同的new Promise语句,其对应的then对调被放入到微任务队列中,注意new Promise语句后面还有一个console函数,该函数会在执行完new Promise语句后立即执行,也就是打印then2,现在微任务对垒还是有一项任务,所以接下来就是打印then4。目前为止,微任务队列已经为空了,可以继续执行宏任务队列了

  • 所以接下里的宏任务set2会被打印,宏任务执行完毕

  • 整个代码的打印结果是:pr1 -> 2 -> then1 -> queueMicrotask -> then3 -> set1 -> then2 -> then4 -> set2

面试题

考点:main scriptsetTimeoutPromisethenqueueMicrotaskawaitasync

知识补充:async、await是Promise的一个语法糖,在处理事件循环问题时

  • 我们可以将await关键字后面执行的代码,看做是包裹在new Promise((resolve,rejcet) => { 函数执行 })中的代码
  • await语句后面的代码,可以看做是上一个Promise中的then(res => {函数执行})中的代码
async function async1() {
  console.log(&#39;async1 start&#39;);
  await async2()
  console.log(&#39;async1 end&#39;);
}

async function async2() {
  console.log(&#39;async2&#39;);
}

console.log(&#39;script start&#39;);

setTimeout(() => {
  console.log(&#39;setTimeout&#39;);
}, 0)

async1()

new Promise(resolve => {
  console.log(&#39;promise1&#39;);
  resolve()
}).then(() => {
  console.log(&#39;promise2&#39;);
})

console.log(&#39;script end&#39;);

// script start
// async1 start
// async2
// promise1
// script end
// async1 end
// promise2
// setTimeout
  • 一开始都是函数的定义,不需要压入函数调用栈中执行,直到遇到第一个console语句,压栈后执行打印script start后出栈

  • 遇到第一个setTimeout函数,其对应的timer会被放入到宏任务队列中

  • async1函数被执行,首先打印出async1 start,然后又去执行await语句后面的async2函数,因为前面也说了,将await关键字后面的函数看成是new Promise里面的语句,这个函数是会被立即执行的,所以async2会被打印出来,但该await语句后面的代码相当于是放入到then回调中的,也就是说console.log('async1 end')这行代码被放入到了微任务队列里

  • 程式碼繼續執行,又遇到了一個new Promise語句,所以立即印出了promise1,then回呼中的函數被放入到了微任務佇列裡面去

  • 最後一個console函數執行列印script end,同步程式碼也就執行完畢了,事件循環要去巨集任務和微任務佇列裡面執行任務了

  • 首先是去微任務佇列,第一個微任務對應的列印語句會被執行,也就是說async1 end會被列印,然後就是promise2 被列印,此時微任務佇列已經為空,開始去執行巨集任務佇列中的任務了

  • timer函數對應的setTimeout會被列印,此時巨集任務也執行完畢,最終的打印順序是:script start -> async1 start -> async2 -> promise1 -> script end -> async1 end -> promise2 -> setTimeout

更多node相關知識,請造訪:nodejs 教學

以上是淺析Node.js中的Buffer,聊聊事件循環的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:juejin.cn。如有侵權,請聯絡admin@php.cn刪除