PHP 확장을 작성할 때 매개변수(즉, zend_parse_parameters에 전달된 변수)가 자유로울 필요는 없는 것 같습니다.
예:
-
-
PHP_FUNCTION(테스트)
- {
- char* str;
- int str_len;> ;
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &str, &str_len) == FAILURE) {
- RETURN_FALSE;
- }
- // free(str) 필요 없음
- }
-
코드 복사
잘 실행됩니다:
test("Hello World"); // Hello World를 인쇄합니다.
여기에서는 테스트 함수의 메모리 누수에 대해 걱정할 필요가 없습니다. PHP는 매개변수를 저장하는 데 사용되는 이러한 변수를 자동으로 재활용하도록 도와줍니다.
그럼 PHP는 어떻게 하는 걸까요? 이 문제를 설명하려면 PHP가 매개변수를 전달하는 방법을 살펴봐야 합니다.
EG(argument_stack) 소개
간단히 말해서 매개변수를 저장하는 데 특별히 사용되는 스택은 PHP의 EG에 인수_스택이라는 이름으로 저장됩니다. 함수 호출이 발생할 때마다 PHP는 들어오는 매개변수를 EG(argument_stack)로 푸시합니다. 함수 호출이 끝나면 EG(argument_stack)가 지워지고 다음 함수 호출을 기다립니다.
EG(argument_stack)의 구조체 구조와 목적과 관련하여 php5.2와 5.3 구현에는 약간의 차이가 있습니다. 이번 글에서는 주로 5.2를 예로 들고, 5.3의 변경사항에 대해서는 나중에 다루겠습니다.
위 그림은 5.2의 Argument_Stack을 개략적으로 나타낸 그림으로, 단순하고 명료해 보입니다. 그 중 스택의 상단과 하단은 NULL로 고정됩니다. 함수가 받은 매개변수는 왼쪽에서 오른쪽 순서로 스택에 푸시됩니다. 스택의 매개변수 수(위 그림에서는 10)를 나타내는 추가 긴 값이 끝에 푸시됩니다.
argument_stack에 푸시되는 매개변수는 무엇인가요? 실제로 이는 zval 유형의 포인터입니다.
그들이 가리키는 zva는 CV 변수, is_ref=1인 변수, 상수 또는 상수 문자열일 수 있습니다.
EG(argument_stack)는 php5.2에서 zend_ptr_stack 유형으로 구체적으로 구현됩니다.
-
- typedef struct _zend_ptr_stack {
- int top; // 스택의 현재 요소 수
- int max; 스택에 저장된 요소 수
- void **elements; // 스택 하단
- void **top_element; // 스택 상단
- } zend_ptr_stack;
-
코드 복사
argument_stack 초기화
Argument_stack 초기화 작업은 PHP가 특정 요청을 처리하기 전에 발생합니다. 더 정확하게 말하면 PHP 인터프리터의 시작 프로세스 중에 발생합니다.
init_executor 함수에는 다음 두 줄이 있습니다.
-
- zend_ptr_stack_init(&EG(argument_stack));
- zend_ptr_stack_push(&EG(argument_stack), (void *) NULL);
코드 복사
이 두 줄은 각각 EG(argument_stack)를 초기화한 다음 NULL을 푸시하는 것을 나타냅니다. EG는 전역 변수이므로 zend_ptr_stack_init가 실제로 호출되기 전에는 EG(argument_stack)의 모든 데이터가 모두 0입니다.
zend_ptr_stack_init 구현은 매우 간단합니다.
-
- ZEND_API void zend_ptr_stack_init(zend_ptr_stack *stack)
- {
- stack->top_element = stack->elements = (void **) emalloc(sizeof(void *)*PTR_STACK_BLOCK_SIZE);
- stack->max = PTR_STACK_BLOCK_SIZE; // 스택 크기는 64로 초기화됩니다.
- stack->top = 0; elements is 0
- }
-
코드 복사
argument_stack이 초기화되면 NULL이 즉시 푸시됩니다. 여기서 자세히 설명할 필요는 없습니다. 이 NULL은 실제로 의미가 없습니다.
NULL이 스택에 푸시된 후 전체 인수_스택의 실제 메모리 분포는 다음과 같습니다.
스택에 매개변수 푸시
첫 번째 NULL을 푸시한 후 다른 매개변수가 스택에 푸시되면 인수_스택에서 다음 작업이 발생합니다.
스택->맨 위 ;
*(스택->top_element) = 매개변수;
간단한 PHP 코드를 사용하여 문제를 설명합니다.
-
- function foo( $str ){
- print_r(123);
- }
- foo("hello world");
-
코드 복사
위 코드는 foo를 호출할 때 문자열 상수를 전달합니다. 따라서 실제로 스택에 푸시되는 것은 저장소 "hello world"를 가리키는 zval입니다. 컴파일된 opcode를 보려면 vld를 사용하십시오.
-
- line # * op fetch ext return 피연산자
- ---------------------- ------------------------------------- ----------
- 3 0 > NOP
- 6 1 SEND_VAL OP1[ IS_CONST (458754) 'hello world' ]
- 2 DO_FCALL 1 OP1[ IS_CONST (458752) 'foo' ]
- 15 3 > RETURN OP1[ IS_CONST (0) 1 ]
-
코드 복사
SEND_VAL 명령이 실제로 수행하는 작업은 " "입니다. hello world"가 인수 스택에 푸시됩니다.
value = &opline->op1.u.constant;
ALLOC_ZVAL(valptr); INIT_PZVAL_COPY(valptr, value); if (!0 ) { - zval_copy_ctor(valptr);
- }
// 스택으로 푸시하고, valptr은 hello world를 저장하는 zval을 가리킵니다.
- zend_ptr_stack_push(&EG(argument_stack ), valptr); ……
- }
-
-
-
- 코드 복사
-
-
- 푸시가 완료된 후의 인수_스택은 다음과 같습니다. :
-
-
-
-
- 매개변수 수
앞서 언급했듯이 실제로는 모든 매개변수를 스택에 푸시하는 것이 아닙니다. PHP는 또한 매개변수 수를 나타내기 위해 추가 숫자를 푸시합니다. 이 작업은 SEND_XXX 명령 중에는 발생하지 않습니다. 실제로 함수를 실제로 실행하기 전에 PHP는 여러 매개변수를 스택에 푸시합니다.
위의 예를 계속 사용하면 DO_FCALL 명령어를 사용하여 foo 함수를 호출합니다. foo를 호출하기 전에 PHP는 자동으로 인수_스택의 마지막 부분을 채웁니다.
static int zend_do_fcall_common_helper_SPEC(ZEND_OPCODE_HANDLER_ARGS){ … // 인수_스택에 2개의 값 푸시 / / 하나는 매개변수의 개수입니다(예: opline->extended_value) // 하나는 스택의 상단을 식별하는 NULL입니다 zend_ptr_stack_2_push(&EG(argument_stack), (void *)(zend_uintptr_t)opline-> ;extended_value, NULL ); …… if (EX(function_state).function->type == ZEND_INTERNAL_FUNCTION) { ……- }
- else if (EX(function_state) .function-> ;type == ZEND_USER_FUNCTION) {
- …
- // foo 함수 호출
- zend_execute(EG(active_op_array) TSRMLS_CC);
- }
- else { /* ZEND_OVERLOADED_FUNCTION */
- … …
- }
- …
- // 인수 스택 지우기
- zend_ptr_stack_clear_multiple(TSRMLS_C);
- …
- ZEND_VM_NEXT_OPCODE();
- }
-
-
-
-
-
- 코드를 복사하고 매개변수 개수와 NULL을 푸시하면 foo 호출에 대한 전체 인수_스택이 완료되었습니다.
- 매개변수 가져오기
위의 예를 계속합니다.
foo 함수를 살펴보고 foo의 opcode가 어떻게 생겼는지 확인하세요.
-
-
-
-
line # * op fetch ext return 피연산자 ---------------------- ------------------------------------- ---------- 3 0 > RECV OP1[ IS_CONST (0) 1 ] 4 1 SEND_VAL OP1[ IS_CONST (5) 123 ] 2 DO_FCALL 1 OP1[ IS_CONST ( 459027) 'print_r' ] 5 3 > RETURN OP1[ IS_CONST (0) null ] 코드 복사-
-
첫 번째 명령어는 RECV로, 문자 그대로 스택에서 매개변수를 가져오는 데 사용됩니다. 실제로 SEND_VAL과 RECV는 어느 정도 상응하는 느낌을 갖고 있습니다. 각 함수 호출 전에 SEND_VAL, RECV는 함수 내부에서 수행됩니다. 실제로 RECV 명령이 반드시 필요한 것은 아닙니다. RECV는 사용자 정의 함수가 호출될 때만 생성됩니다. 우리가 작성하는 확장 함수와 PHP와 함께 제공되는 내장 함수에는 RECV가 없습니다.
각 SEND_VAL 및 RECV는 하나의 매개변수만 처리할 수 있다는 점에 유의해야 합니다. 즉, 매개변수 전달 과정에서 여러 개의 매개변수가 있는 경우 여러 개의 SEND_VAL과 여러 개의 RECV가 생성됩니다. 이는 매우 흥미로운 주제로 이어집니다. 매개변수를 전달하고 매개변수를 가져오는 순서는 무엇입니까?
대답은 SEND_VAL이 스택에 매개변수를 왼쪽에서 오른쪽으로 푸시하는 반면, RECV는 매개변수를 왼쪽에서 오른쪽으로 가져오는 것입니다.
-
-
static int ZEND_RECV_SPEC_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
- {
- … // param이 매개변수를 취하는 순서는 다음과 같습니다. 스택 상단 --> 스택 하단
- if (zend_ptr_stack_get_arg(arg_num, (void **) ¶m TSRMLS_CC)==FAILURE) {
- ……
- } else {
- zend_free_op free_res;
- zval **var_ptr;
// 매개변수 확인
- zend_verify_arg_type((zend_function *) EG(active_op_array), arg_num, *param TSRMLS_CC);
- var_ptr = get_zval_ptr_ptr (&opline ->result, EX(Ts), &free_res, BP_VAR_W);
-
- // 매개변수 가져오기
- if (PZVAL_IS_REF(*param)) {
- zend_sign_to_variable_reference(var_ptr, param TSRMLS_CC);
- } else {
- zend_receive(var_ptr, *param TSRMLS_CC);
- }
- }
ZEND_VM_NEXT_OPCODE();
- } ;
-
코드 복사
zend_sign_to_variable_reference 및 zend_receive는 "매개변수 가져오기"를 완료합니다. "매개변수 가져오기"는 실제로 무엇을 수행하는지 이해하기 쉽지 않습니다.
최종 분석에서는 매우 간단합니다. "매개변수 가져오기"는 현재 함수 실행 중에 이 매개변수를 "심볼 테이블"에 추가하는 것입니다. 이는 구체적으로 EG(current_execute_data)->symbol_table에 해당합니다. 이 예에서는 RECV가 완료된 후 함수 본문의 Symbol_table에 'str' 기호가 있고 해당 값은 "hello world"입니다.
그러나 RECV는 매개변수만 읽고 스택에 유사한 팝 작업을 발생시키지 않기 때문에 인수_스택은 전혀 변경되지 않았습니다.
argument_stack 정리
foo 내부의 print_r도 함수 호출이므로 스택 푸시-->스택 지우기 작업도 발생합니다. 따라서 print_r이 실행되기 전의 인수_스택은 다음과 같습니다.
print_r이 실행된 후 인수_스택은 foo가 방금 RECV를 마친 상태로 돌아갑니다.
print_r을 호출하는 특정 프로세스는 이 기사의 초점이 아닙니다. 우리가 관심을 갖는 것은 PHP가 foo를 호출한 후 인수_스택을 정리하는 방법입니다.
위에 표시된 do_fcall 코드 조각에서 볼 수 있듯이 정리 작업은 zend_ptr_stack_clear_multiple에 의해 완료됩니다.
-
- static inline void zend_ptr_stack_clear_multiple(TSRMLS_D)
- {
- void **p = EG(argument_stack).top_element-2;
- / / 스택 상단에 저장된 매개변수 개수를 가져옵니다
- int delete_count = (int)(zend_uintptr_t) *p
- EG(argument_stack).top -= (delete_count 2);
-
- // 위에서 아래로 순서대로 정리
- while (--delete_count>=0) {
- zval *q = *(zval **)(--p);
- *p = NULL;
- zval_ptr_dtor( &q);
- }
- EG(argument_stack).top_element = p;
- }
코드 복사
여기서 zval_ptr_dtor를 사용하여 스택의 zval 포인터가 지워집니다. zval_ptr_dtor는 참조 횟수를 1씩 감소시킵니다. 참조 횟수가 0으로 감소하면 변수를 저장하는 메모리 영역이 실제로 재활용됩니다.
이 기사의 예에서는 foo가 호출된 후 "hello world"의 zval 상태가 저장됩니다.
-
- 값 "hello world"
- refcount 1
- type 6
- is_ref 0
-
코드 복사
refcount는 1이므로 zval_ptr_dtor는 실제로 메모리에서 "hello world"를 삭제합니다.
스택 제거 후 인수_스택의 메모리 상태는 다음과 같습니다.
위 그림의 인수_스택이 방금 초기화된 것과 동일한 것을 볼 수 있습니다. 이 시점에서 인수_스택은 다음 함수 호출을 위한 준비가 되었습니다.
글 시작 부분의 질문으로 돌아가서...
왜 free(str)가 필요하지 않나요? Argument_Stack을 이해하고 나면 이 문제를 쉽게 이해할 수 있습니다.
str은 "hello world"가 실제로 zval에 저장된 메모리 주소를 가리키기 때문입니다. 확장 기능은 다음과 같다고 가정합니다.
-
-
PHP_FUNCTION(테스트)
- {
- char* str;
- int str_len;> ;
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &str, &str_len) == FAILURE) {
- RETURN_FALSE;
- }
}
-
코드 복사
-
- $a = "hello world";
- test($a);
- echo $a;
-
코드를 복사하면
"Hello world"가 출력됩니다. test를 호출할 때 $a의 참조를 전달하지 않지만 실제 효과는 test(&$a)와 동일합니다.
간단히 말하면 CV 배열이든 인수_스택이든 메모리에는 $a의 복사본이 하나만 있습니다. zend_parse_parameters는 함수 실행을 위해 데이터 복사본을 복사하지 않으며 실제로 복사할 수도 없습니다. 따라서 함수가 완료되었을 때 $a가 다른 곳에서 사용되지 않으면 PHP는 인수_스택을 정리할 때 이를 해제하는 데 도움을 줍니다. 여전히 다른 코드에서 사용 중이라면 수동으로 해제할 수 없습니다. 그렇지 않으면 $a의 메모리 영역이 파괴됩니다.
확장 함수 작성에 사용된 모든 변수가 PHP에서 자동으로 재활용되는 것은 아닙니다. 그러니 자유로워질 때, 부드러워지지 마세요 :)
|