首頁 >web前端 >js教程 >聊聊Node.js中的 GC (垃圾回收)機制

聊聊Node.js中的 GC (垃圾回收)機制

青灯夜游
青灯夜游轉載
2022-11-29 20:44:082239瀏覽

Node 是如何做 GC (垃圾回收)的?下面這篇文章就來帶大家了解一下。

聊聊Node.js中的 GC (垃圾回收)機制

GC,Garbage Collection,垃圾回收。在程式設計中,一般指的是記憶體自動回收機制,會定時將不需要用到的資料進行清除。

Node.js 底層使用了 V8 引擎。 V8 是 Google 開源的高效能 JavaScript 引擎,使用了 C 來編寫。 【相關教學推薦:nodejs影片教學

Node.js 的記憶體主要分成三個部分:

  • 程式碼空間:存放程式碼段的地方;

  • 堆疊:函數呼叫堆疊產生的臨時變量,為一些基本類型,例如數字、字串、布林值,以及物件參考(保存的是地址,不保存對象本身)。

  • 堆:存放物件等資料;

#堆記憶體

Node.js 底層使用的是V8,下面來講解V8 的記憶體回收機制。

首先 JS 中所有的物件都會保存在堆記憶體中。在創建進程的時候,會分配一個初始大小的堆內存,然後我們的物件就會放到裡面。

當物件越來越多,堆記憶體會不夠用,此時堆記憶體會動態地擴大。如果到達一個最大限制(現在通常是 4GB),就會堆疊記憶體溢位的錯誤,然後終止 Node.js 進程。

新生代與老生代

V8 先將記憶體分成兩部分,或說兩個生代(generation):

  • 新生代(yong generation):保存一些存活時間較短的物件;

  • 老生代(old generation):保存存活時間長或長駐的物件。

新生代很小,這裡會存放一些存活時間很短的對象,通常它們會被頻繁地回收(例如函數的呼叫堆疊的一些臨時物件)。

新生代可透過 node --max-semi-space-size=SIZE index.js 修改新生代的大小,單位為 MB。

另外,老生代則透過--max-old-space-size=SIZE 來設定

新生代的Scavenge 演算法

新生代使用了Scavenge 演算法,是一種基於copy(複製)的演算法。

新生代會分成兩個空間,這個空間稱為semispace,它們為:

  • From 空間:新宣告的物件會放入這裡

  • To 空間:用作移動的空間

新宣告的物件會放入到From 空間中,From 空間的物件緊密排布,透過指針,上一對象緊貼下一個對象,是記憶體連續的,不用擔心記憶體碎片的問題。

所謂記憶體碎片,指的是空間分配不均勻,產生大量小的連續空間,無法放入一個大物件。

當 From 空間快滿了,我們就會遍歷找出活躍對象,將它們 copy 到 To 空間。此時 From 空間其實就空了,然後我們將 From 和 To 互換身分。

如果有些物件被 copy 了多次,會被認為存活時間較長,將會被移到老生代。

這種基於copy 的演算法,優點是可以很好地處理記憶體碎片的問題,缺點是會浪費一些空間作為搬運的空間位置,此外因為拷貝比較耗費時間,所以不適合分配太大的記憶體空間,更多是做一種輔助GC。

Mark-Sweep 和Mark-Compact

老生代的空間就比新生代大得多了,放的是一些存活時間長的對象,用的是Mark-Sweep (標記清除)演算法。

首先是標記階段。從根集 Root Set(執行堆疊和全域物件)往上找到所有能存取的對象,並標記它們為活躍物件。

標記完後,就是清除階段,將沒有標記的物件清除,其實就是標記一下這個記憶體位址為空閒。

這種做法會導致 空閒記憶體空間碎片化,當我們創建了一個大的連續對象,就會找不到地方放下。這時候,就要用 Mark-Compact(標記整理)來將碎片的活躍物件做一個整合。

Mark-Compact 會將所有活躍物件拷貝移動到一端,然後邊界的另一邊就是一整塊的連續可用記憶體了。

考慮到Mark-Sweep 和Mark-Compact 花費的時間很長,而且會阻塞JavaScript 的線程,所以通常我們不會一次性做完,而是用增量標記(Incremental Marking)的方式。也就是做斷斷續續地標記,小步走,垃圾回收和應用邏輯交替進行。

另外,V8 也做了平行標記和並行清理,提高執行效率。

聊聊Node.js中的 GC (垃圾回收)機制

查看記憶體相關資訊

我們可以透過 process.memoryUsage 方法拿到記憶體相關的一些資訊。

process.memoryUsage();

#輸出內容為:

{
  rss: 35454976,
  heapTotal: 7127040,
  heapUsed: 5287088,
  external: 958852,
  arrayBuffers: 11314
}

說明

  • rss:常駐記憶體大小(resident set size),包含程式碼片段、堆疊記憶體、棧等部分。

  • heapTotal:V8 的堆記憶體總大小;

  • heapUsed:佔用的堆記憶體;

  • #external:V8 以外的記憶體大小,指的是C 物件佔用的內存,例如Buffer 資料。

  • arrayBuffers:ArrayBufferSharedArrayBuffer 相關的記憶體大小,屬於 external 的一部份。

以上數字的單位都是位元組。

測試最大記憶體限制

寫一個腳本,用一個計時器,讓一個陣列不停地變大,並列印堆記憶體使用情況,直到記憶體溢出。

const format = function (bytes) {
  return (bytes / 1024 / 1024).toFixed(2) + " MB";
};

const printMemoryUsage = function () {
  const memoryUsage = process.memoryUsage();
  console.log(
    `heapTotal: ${format(memoryUsage.heapTotal)}, heapUsed: ${format(
      memoryUsage.heapUsed
    )}`
  );
};

const bigArray = [];
setInterval(function () {
  bigArray.push(new Array(20 * 1024 * 1024));
  printMemoryUsage();
}, 500);

要特別注意的是,不要用 Buffer 來做測試。

因為 Buffer 是 Node.js 特有的處理二進制的對象,它不是在 V8 中的實現的,是 Node.js 用 C 另外實現的,不通過 V8 分配內存,屬於堆外內存。

我使用電腦是macbook pro M1 Pro,Node.js 版本為v16.17.0,使用的V8 版本是9.4.146.26-node.22(透過process.versions .v8 得到)。

輸出結果為(省略了一些多餘的資訊):

heapTotal: 164.81 MB, heapUsed: 163.93 MB
heapTotal: 325.83 MB, heapUsed: 323.79 MB
heapTotal: 488.59 MB, heapUsed: 483.84 MB
...
heapTotal: 4036.44 MB, heapUsed: 4003.37 MB
heapTotal: 4196.45 MB, heapUsed: 4163.29 MB

<--- Last few GCs --->

[28033:0x140008000]    17968 ms: Mark-sweep 4003.2 (4036.4) -> 4003.1 (4036.4) MB, 2233.8 / 0.0 ms  (average mu = 0.565, current mu = 0.310) allocation failure scavenge might not succeed
[28033:0x140008000]    19815 ms: Mark-sweep 4163.3 (4196.5) -> 4163.1 (4196.5) MB, 1780.3 / 0.0 ms  (average mu = 0.413, current mu = 0.036) allocation failure scavenge might not succeed


<--- JS stacktrace --->

FATAL ERROR: Reached heap limit Allocation failed - JavaScript heap out of memory
...

可以看到,是在 4000 MB 之後超出了記憶體上限,發生堆溢出,然後退出了進程。說明在我的機器上,預設的最大記憶體為 4G。

實際最大記憶體和它運作所在的機器有關,如果你的機器的記憶體大小為 2G,最大記憶體將設定為 1.5G。

更多node相關知識,請造訪:nodejs 教學

以上是聊聊Node.js中的 GC (垃圾回收)機制的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:juejin.cn。如有侵權,請聯絡admin@php.cn刪除