>  기사  >  백엔드 개발  >  Python의 가비지 수집 메커니즘에 대한 자세한 설명

Python의 가비지 수집 메커니즘에 대한 자세한 설명

高洛峰
高洛峰원래의
2017-03-24 17:34:451308검색

1. 가비지 수집 메커니즘
Python의 가비지 수집은 주로 참조 카운팅을 기반으로 하며 세대별 수집으로 보완됩니다. 참조 카운팅의 단점은 순환 참조 문제입니다.
Python에서 개체에 대한 참조 수가 0이면 Python 가상 머신은 이 개체의 메모리를 회수합니다.

#encoding=utf-8
__author__ = 'kevinlu1010@qq.com'
 
class ClassA():
  def __init__(self):
    print 'object born,id:%s'%str(hex(id(self)))
  def __del__(self):
    print 'object del,id:%s'%str(hex(id(self)))
 
def f1():
  while True:
    c1=ClassA()
    del c1


f1()을 실행하면 이러한 결과가 루프로 출력되며 프로세스가 차지하는 메모리는 기본적으로 변경되지 않습니다.

object born,id:0x237cf58
object del,id:0x237cf58


c1=ClassA()는 0x237cf58 메모리에 배치된 c1 변수는 이 메모리의 참조 횟수가 1입니다.
del c1 이후에는 c1 변수가 더 이상 0x237cf58 메모리를 가리키지 않으므로 참조는 이 메모리의 개수는 1씩 감소하여 0이 됩니다. 따라서 개체가 파괴되고 메모리가 해제됩니다.
참조 카운트가 +1이 되는 상황
객체가 생성됩니다(예: a=23)
객체가 참조됩니다.예: b=a
객체가 매개변수로 전달됩니다. func( a)와 같은 함수
개체는 컨테이너에 요소로 저장됩니다(예: list1=[a,a]
참조 횟수가 -1이 됨). 객체는 명시적으로 삭제됩니다(예: del a
객체의 별칭은 a=24
와 같이 새 객체에 할당됨
예를 들어 f 함수가 실행을 완료하면 객체가 해당 범위를 벗어남). func 함수의 변수(전역 변수는 그렇지 않음)
객체가 위치한 컨테이너가 파괴되거나 객체가 컨테이너에서 삭제됩니다.
demo

def func(c,d):
  print 'in func function', sys.getrefcount(c) - 1
 
 
print 'init', sys.getrefcount(11) - 1
a = 11
print 'after a=11', sys.getrefcount(11) - 1
b = a
print 'after b=1', sys.getrefcount(11) - 1
func(11)
print 'after func(a)', sys.getrefcount(11) - 1
list1 = [a, 12, 14]
print 'after list1=[a,12,14]', sys.getrefcount(11) - 1
a=12
print 'after a=12', sys.getrefcount(11) - 1
del a
print 'after del a', sys.getrefcount(11) - 1
del b
print 'after del b', sys.getrefcount(11) - 1
# list1.pop(0)
# print 'after pop list1',sys.getrefcount(11)-1
del list1
print 'after del list1', sys.getrefcount(11) - 1


출력:

init 24
after a=11 25
after b=1 26
in func function 28
after func(a) 26
after list1=[a,12,14] 27
after a=12 26
after del a 26
after del b 25
after del list1 24


질문: 함수를 호출하면 참조 카운트가 2만큼 증가하는 이유
객체의 참조 카운트 보기
sys.getrefcount(a)는 객체의 참조 카운트를 확인할 수 있지만, 함수를 호출할 때 a가 전달되어 a의 참조 카운트가 1씩 증가하기 때문에 일반 카운트보다 1이 큽니다.
2. 순환 참조로 인해 메모리 누수가 발생합니다

def f2():
  while True:
    c1=ClassA()
    c2=ClassA()
    c1.t=c2
    c2.t=c1
    del c1
    del c2


f2()가 실행되면 프로세스가 차지하는 메모리는 계속 증가합니다.

object born,id:0x237cf30
object born,id:0x237cf58


c1과 c2를 생성한 후 이 두 메모리의 참조 횟수는 0x237cf30(c1에 해당하는 메모리, 메모리 1로 기록됨), 0x237cf58(c2에 해당하는 메모리, 메모리 2로 기록됨)입니다. ).은 1입니다. c1.t=c2 및 c2.t=c1을 실행한 후 이 두 메모리의 참조 횟수는 2가 됩니다.
del c1 이후에는 메모리 1에 있는 개체의 참조 횟수가 1이 됩니다. 0이 아니기 때문에 메모리 1의 객체는 소멸되지 않으므로 메모리 2의 객체에 대한 참조 수는 여전히 2입니다. del c2 이후에도 같은 방식으로 메모리의 객체에 대한 참조 수는 1이고 메모리 2의 개체는 1입니다.
순환 참조로 인해 두 객체가 모두 파괴될 수 있지만 가비지 수집기는 객체를 재활용하지 않으므로 메모리 누수가 발생합니다.
3. 가비지 수집

deff3():
  # print gc.collect()
  c1=ClassA()
  c2=ClassA()
  c1.t=c2
  c2.t=c1
  del c1
  del c2
  print gc.garbage
  print gc.collect() #显式执行垃圾回收
  print gc.garbage
  time.sleep(10)
if __name__ == '__main__':
  gc.set_debug(gc.DEBUG_LEAK) #设置gc模块的日志
  f3()


출력:
Python

gc: uncollectable <ClassA instance at 0230E918>
gc: uncollectable <ClassA instance at 0230E940>
gc: uncollectable <dict 0230B810>
gc: uncollectable <dict 02301ED0>
object born,id:0x230e918
object born,id:0x230e940


4
가비지 수집 후 개체는 다음과 같습니다. gc.garbage 목록에 배치
gc.collect()는 연결할 수 없는 개체 수를 반환합니다. 4는 두 개체 및 해당 dict와 같습니다
가비지 수집을 트리거하는 세 가지 상황이 있습니다:
1 .gc .collect()를 호출하세요.
2.gc 모듈의 카운터가 임계값에 도달하면.
3. 프로그램 종료 시
4. gc 모듈의 공통 기능 분석

Garbage Collector interface


gc 모듈은 개발자가 가비지 컬렉션을 설정할 수 있는 인터페이스를 제공합니다. 옵션. 위에서 언급한 바와 같이 참조 카운팅 방식을 사용하여 메모리를 관리할 때 나타나는 결점 중 하나가 순환 참조이며, gc 모듈의 주요 기능 중 하나는 순환 참조 문제를 해결하는 것입니다.
일반적으로 사용되는 함수:
gc.set_debug(flags)
gc의 디버그 로그를 설정합니다. 일반적으로 gc.DEBUG_LEAK로 설정됩니다.
gc.collect([세대])
명시적 가비지 수집, 매개변수를 입력할 수 있으며, 0은 1세대 개체만 확인한다는 의미이고, 1은 1세대와 2세대 개체를 확인한다는 의미이며, 2는 매개변수가 전달되지 않은 경우 1세대, 2세대, 3세대 개체를 확인한다는 의미입니다. , 전체 컬렉션이 실행되며 이는 2 를 전달하는 것과 동일합니다.
도달할 수 없는 개체 수를 반환합니다
gc.set_threshold(threshold0[, Threshold1[, Threshold2])
자동 가비지 수집 빈도를 설정합니다.
gc.get_count()
현재 자동 가비지 수집 카운터를 가져오고 길이 3의 목록을 반환합니다.
gc 모듈의 자동 가비지 수집 메커니즘
gc 모듈을 가져와야 하며 is_enable()입니다. =True는 자동 가비지 수집을 시작합니다.
이 메커니즘의 주요 기능은 도달할 수 없는 쓰레기 객체를 발견하고 처리하는 것입니다.
가비지 컬렉션 = 가비지 체크 + 가비지 컬렉션
파이썬에서는 세대별 컬렉션 방식을 사용합니다. 객체를 3세대로 나누면 처음에 객체가 생성되면 1세대에 배치되고, 변경된 객체가 1세대의 가비지 체크를 통과하면 2세대에 배치됩니다. 세대 가비지 검사, 객체가 가비지 검사에서 살아남으면 3세대에 배치됩니다.
gc 모듈에는 gc.get_count()를 통해 얻을 수 있는 길이가 3인 카운터가 있습니다.
예를 들어 (488,3,0)에서 488은 Python에서 할당한 메모리 수에서 마지막 세대 가비지 검사 이후 해제된 메모리 수를 뺀 값입니다. 참조 증가가 아니라 메모리 할당이라는 점에 유의하세요. 세다. 예:

print gc.get_count() # (590, 8, 0)
a = ClassA()
print gc.get_count() # (591, 8, 0)
del a
print gc.get_count() # (590, 8, 0)


3是指距离上一次二代垃圾检查,一代垃圾检查的次数,同理,0是指距离上一次三代垃圾检查,二代垃圾检查的次数。
gc模快有一个自动垃圾回收的阀值,即通过gc.get_threshold函数获取到的长度为3的元组,例如(700,10,10)
每一次计数器的增加,gc模块就会检查增加后的计数是否达到阀值的数目,如果是,就会执行对应的代数的垃圾检查,然后重置计数器
例如,假设阀值是(700,10,10):
当计数器从(699,3,0)增加到(700,3,0),gc模块就会执行gc.collect(0),即检查一代对象的垃圾,并重置计数器为(0,4,0)
当计数器从(699,9,0)增加到(700,9,0),gc模块就会执行gc.collect(1),即检查一、二代对象的垃圾,并重置计数器为(0,0,1)
当计数器从(699,9,9)增加到(700,9,9),gc模块就会执行gc.collect(2),即检查一、二、三代对象的垃圾,并重置计数器为(0,0,0)
其他
如果循环引用中,两个对象都定义了__del__方法,gc模块不会销毁这些不可达对象,因为gc模块不知道应该先调用哪个对象的__del__方法,所以为了安全起见,gc模块会把对象放到gc.garbage中,但是不会销毁对象。
五.应用
 项目中避免循环引用
 引入gc模块,启动gc模块的自动清理循环引用的对象机制
 由于分代收集,所以把需要长期使用的变量集中管理,并尽快移到二代以后,减少GC检查时的消耗
 gc模块唯一处理不了的是循环引用的类都有__del__方法,所以项目中要避免定义__del__方法,如果一定要使用该方法,同时导致了循环引用,需要代码显式调用gc.garbage里面的对象的__del__来打破僵局

위 내용은 Python의 가비지 수집 메커니즘에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.