這篇文章跟大家介紹一下垃圾回收,淺析PHP中垃圾回收機制,最後聊聊垃圾回收對效能的影響,一起開看看吧!
相信只要入門學習過一點開發的同學都知道,不管任何程式語言,一個變數都會保存在記憶體中。其實,我們這些開發者就是在來回不停地操縱內存,相應地,我們如果一直增加新的變量,內存就會一直增加,如果沒有一個好的機制,那麼內存就會無限制地增加最終撐滿所有的記憶體。這就造成了記憶體外洩。但在日常開發中,除非一次載入一個很大的文件,我們幾乎見不到記憶體超限的錯誤,這就是垃圾回收機制的作用。
在使用C 語言的時候,我們都要手動使用free 來釋放內存,在C 之後的大部分程式語言都會自帶一個垃圾回收之類的處理能力,也就是我們今天要說的垃圾回收機制,也稱為GC 。在有 GC 能力的開發語言中,我們不需要去關心什麼時候釋放內存,甚至我們完全不需要去了解這一塊的內容,因為這些語言在底層已經幫我們處理好了關於內存釋放的問題。
當然這方面的內容最有名的就是Java 中的垃圾回收機制,其實PHP 也有對應的處理機制,當然,很多PHPer 可能從來沒接觸過,今天我們就來探討一下這方面的內容。
在先前的文章中,我們有介紹過引用計數的概念。在 PHP5.3 之前,PHP 的垃圾回收機制非常簡單,就是把 refcount 為0的全部清理回收掉,在底層也就是 free 掉了。但這種方式會帶來一個問題,也就是我們在引用數數這篇文章中說過的循環引用,這種引用問題透過普通的判斷 refcount 的方式是無法回收的。所以在 PHP5.3 之前,循環引用是會造成記憶體外洩的。
之所以強調版本,那是因為在 5.3 之後,PHP 改進了垃圾回收的演算法,使這種循環引用得到了解決。 (當然,我們在日常開發中盡量避免這種循環引用的問題)。具體演算法我們引用官方的圖片:
在官方文件中有詳盡的解釋,不過還是會看得很懵逼。我們就用簡單的語言(說人話)來描述這個過程。
首先,我們有個根緩衝區的概念,就是圖中的 root 。在底層透過一系列看不懂搞不明白的演算法我們能找到每個變數的一個可能根。 PHP 會將變數的可能根放入根緩衝區。
當根緩衝區滿了的時候,一般這個預設值是10000,需要修改原始碼重新編譯才能修改這個值。 PHP 就會啟動垃圾回收機制,從根緩衝區中按照深度遍歷的演算法來找出所有的和這個可能根相關的變量,並將某一個可能根找到的變量的refcount 減1,並做一個標記當前這個「已減」。
然後再次深度遍歷,如果 refcount 不是0的,就加1,如果是0的就保持不變。
接著清除根緩衝區中的所有可能根,清除而不是刪除。然後清理釋放所有的 refcount 為0的變數內容。
是不是已經懵逼了?其實我也很懵逼,都不知道這段是怎麼寫下來的....
記住幾個要點就可以對付面試併秒殺大部分人了。
前文說過,垃圾回收在根緩衝區滿了之後會馬上執行。其中也會進行兩次的深度遍歷,這就不可避免的帶來了性能的消耗。畢竟演算法的執行都是需要耗時的。不過相對於記憶體溢出這種毀滅性的錯誤來說,垃圾回收帶來的效能損耗基本上是可以忽略不計的。
垃圾回收的內容其實我們只需要記住幾個關鍵點就可以了,具體的核心演算法和內容是需要在更深入的研究源碼後才能完全了解的,當然,這也是我們學習的目標,之後也一定會涉獵源碼底層的相關內容,就讓我們拭目以待吧!
推薦學習:《PHP影片教學》
以上是PHP中什麼是垃圾回收?對性能有什麼影響的詳細內容。更多資訊請關注PHP中文網其他相關文章!