1. 생성기가 필요한 이유
위의 학습을 통해 목록 생성 공식을 알 수 있고, 목록을 직접 생성할 수도 있습니다. 그러나 메모리 제약으로 인해 목록 용량은 확실히 제한됩니다. 더욱이 1,000만 개의 요소가 포함된 목록을 만드는 것은 많은 저장 공간을 차지할 뿐만 아니라 처음 몇 개의 요소에만 액세스해야 한다면 대부분의 후속 요소가 차지하는 공간이 낭비됩니다.
그렇다면 특정 알고리즘에 따라 목록 요소를 계산할 수 있다면 루프 중에 후속 요소를 지속적으로 계산할 수 있습니까? 이렇게 하면 전체 목록을 만들 필요가 없으므로 많은 공간이 절약됩니다. Python에서는 이러한 반복과 계산을 동시에 수행하는 메커니즘을 생성기(generator)라고 합니다.
Python에서는 Yield를 사용하는 함수를 생성기라고 합니다.
일반 함수와 다르게 생성기는 반복자를 반환하는 함수이며 반복 작업에만 사용할 수 있습니다. 생성기는 반복자라는 것을 이해하는 것이 더 쉽습니다.
생성기를 실행하도록 호출하는 과정에서 Yield를 만날 때마다 함수는 일시 중지하고 현재 실행 중인 모든 정보를 저장하며 Yield 값을 반환합니다. 그리고 다음에 next() 메소드가 실행될 때 현재 위치에서 계속 실행됩니다.
그럼 생성기를 만드는 방법은 무엇일까요?
2. 생성기 만들기
가장 간단하고 쉬운 방법은 목록 생성의 []를 ()
# -*- coding: UTF-8 -*- gen= (x * x for x in range(10)) print(gen)
로 변경하는 것입니다. 출력 결과:
<generator object <genexpr> at 0x0000000002734A40>
목록 생성과 생성기의 유일한 차이점은 다음과 같습니다. 마지막은 외부 []와 ()입니다. 그러나 생성기는 실제로 숫자 목록을 생성하지 않고 대신 항목이 계산될 때마다 항목을 "생성"(생성)하는 생성기를 반환합니다. 생성기 표현식은 "지연 평가"(지연 평가, "지연 평가"라고도 번역됨. 필요에 따라 호출하는 이 방법은 게으른 것으로 번역하는 것이 더 낫다고 생각함)를 사용하고 검색(평가)할 때만 할당되므로 메모리가 더 많습니다. 목록이 길 때 효율적입니다.
그럼 생성기를 만드는 방법은 알지만 내부의 요소는 어떻게 볼 수 있나요?
3. 생성기 요소 탐색
우리 생각에 따르면 for 루프는 탐색에 사용됩니다.
# -*- coding: UTF-8 -*- gen= (x * x for x in range(10)) for num in gen : print(num)
예, 이렇게 직접 탐색할 수 있습니다. 물론 위에서도 반복자(iterator)를 언급했는데, 순회에 next()를 사용할 수 있을까요? 물론 가능합니다.
4. 생성기를 함수 형태로 구현합니다
위에서 언급했듯이 생성기를 생성하는 가장 간단하고 쉬운 방법은 목록 생성에서 []를 ()로 변경하는 것입니다. 왜 갑자기 함수 형태로 생성되는 걸까요?
사실 생성기는 반복자이기도 하지만 한 번만 반복할 수 있습니다. 모든 값을 메모리에 저장하는 것이 아니라 런타임에 값을 생성하기 때문입니다. "for" 루프를 사용하거나 반복할 수 있는 함수나 구조에 전달하여 반복하여 사용합니다. 그리고 실제 응용에서는 대부분의 생성기가 함수를 통해 구현됩니다. 그렇다면 함수를 통해 어떻게 생성합니까?
걱정하지 마세요. 다음 예를 살펴보겠습니다.
# -*- coding: UTF-8 -*- def my_function(): for i in range(10): print ( i ) my_function()
출력 결과:
0 1 2 3 4 5 6 7 8 9
만약 생성기로 전환하려면 print(i)만 변경하여 i를 생성하면 됩니다. 살펴보세요. at it 구체적으로 수정된 예:
# -*- coding: UTF-8 -*- def my_function(): for i in range(10): yield i print(my_function())
출력 결과:
<generator object my_function at 0x0000000002534A40>
그러나 이 예는 생성기를 사용하는 데 매우 부적합하며 생성기의 특성을 최대한 활용할 수 없습니다. 모든 생성기를 동시에 사용하려면 특히 결과 집합에 루프도 포함된 경우 많은 수의 계산된 결과 집합이 메모리에 할당됩니다. 리소스를 많이 소모하기 때문입니다.
예를 들어, 다음은 피보나치 수열을 계산하는 생성기입니다.
# -*- coding: UTF-8 -*- def fibon(n): a = b = 1 for i in range(n): yield a a, b = b, a + b # 引用函数 for x in fibon(1000000): print(x , end = ' ')
실행 효과:
알다시피, 이와 같은 매개변수를 실행해도 정지 상태가 있다고 말할 수는 없습니다. 리소스를 너무 많이 사용하지 마세요. 여기서 가장 이해하기 어려운 점은 제너레이터와 함수의 실행 흐름이 다르다는 점이다. 함수는 순차적으로 실행되며 return 문이나 function 문의 마지막 줄을 만나면 반환됩니다. 제너레이터가 되는 함수는 next()가 호출될 때마다 실행되고, Yield 문을 만나면 반환하고, 다시 실행되면 마지막으로 반환된 Yield 문부터 계속해서 실행됩니다.
예를 들어,
# -*- coding: UTF-8 -*- def odd(): print ( 'step 1' ) yield ( 1 ) print ( 'step 2' ) yield ( 3 ) print ( 'step 3' ) yield ( 5 ) o = odd() print( next( o ) ) print( next( o ) ) print( next( o ) ) 输出的结果: step 1 1 step 2 3 step 3 5
odd는 일반 함수가 아니라 생성기임을 알 수 있습니다. 실행 중에 Yield를 만나면 중단되고 다음에 실행이 계속됩니다. Yield를 3번 실행한 후 더 이상 실행할 Yield가 없습니다. print(next(o))를 계속해서 인쇄하면 오류가 발생합니다. 따라서 오류는 일반적으로 생성기 함수에서 캡처됩니다.
5. 양휘 삼각형 인쇄
생성기를 학습하면 생성기의 지식 포인트를 직접 사용하여 양휘 삼각형을 인쇄할 수 있습니다.
# -*- coding: UTF-8 -*- def triangles( n ): # 杨辉三角形 L = [1] while True: yield L L.append(0) L = [ L [ i -1 ] + L [ i ] for i in range (len(L))] n= 0 for t in triangles( 10 ): # 直接修改函数名即可运行 print(t) n = n + 1 if n == 10: break
출력 결과는 다음과 같습니다.
[1] [1, 1] [1, 2, 1] [1, 3, 3, 1] [1, 4, 6, 4, 1] [1, 5, 10, 10, 5, 1] [1, 6, 15, 20, 15, 6, 1] [1, 7, 21, 35, 35, 21, 7, 1] [1, 8, 28, 56, 70, 56, 28, 8, 1] [1, 9, 36, 84, 126, 126, 84, 36, 9, 1]다음 섹션