>  기사  >  백엔드 개발  >  PHP 매개변수 전달 원리에 대한 심층 분석

PHP 매개변수 전달 원리에 대한 심층 분석

WBOY
WBOY원래의
2016-07-25 09:13:201286검색

PHP 확장을 작성할 때 매개변수(즉, zend_parse_parameters에 전달된 변수)가 자유로울 필요는 없는 것 같습니다. 예:

  1. PHP_FUNCTION(테스트)

  2. {
  3. char* str;
  4. int str_len;> ;
  5. if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &str, &str_len) == FAILURE) {

  6. RETURN_FALSE;
  7. }
  8. // free(str) 필요 없음
  9. }
코드 복사

잘 실행됩니다: test("Hello World"); // Hello World를 인쇄합니다. 여기에서는 테스트 함수의 메모리 누수에 대해 걱정할 필요가 없습니다. PHP는 매개변수를 저장하는 데 사용되는 이러한 변수를 자동으로 재활용하도록 도와줍니다.

그럼 PHP는 어떻게 하는 걸까요? 이 문제를 설명하려면 PHP가 매개변수를 전달하는 방법을 살펴봐야 합니다.

EG(argument_stack) 소개 간단히 말해서 매개변수를 저장하는 데 특별히 사용되는 스택은 PHP의 EG에 인수_스택이라는 이름으로 저장됩니다. 함수 호출이 발생할 때마다 PHP는 들어오는 매개변수를 EG(argument_stack)로 푸시합니다. 함수 호출이 끝나면 EG(argument_stack)가 지워지고 다음 함수 호출을 기다립니다.

EG(argument_stack)의 구조체 구조와 목적과 관련하여 php5.2와 5.3 구현에는 약간의 차이가 있습니다. 이번 글에서는 주로 5.2를 예로 들고, 5.3의 변경사항에 대해서는 나중에 다루겠습니다. PHP 매개변수 전달 원리에 대한 심층 분석

위 그림은 5.2의 Argument_Stack을 개략적으로 나타낸 그림으로, 단순하고 명료해 보입니다. 그 중 스택의 상단과 하단은 NULL로 고정됩니다. 함수가 받은 매개변수는 왼쪽에서 오른쪽 순서로 스택에 푸시됩니다. 스택의 매개변수 수(위 그림에서는 10)를 나타내는 추가 긴 값이 끝에 푸시됩니다.

argument_stack에 푸시되는 매개변수는 무엇인가요? 실제로 이는 zval 유형의 포인터입니다. 그들이 가리키는 zva는 CV 변수, is_ref=1인 변수, 상수 또는 상수 문자열일 수 있습니다.

EG(argument_stack)는 php5.2에서 zend_ptr_stack 유형으로 구체적으로 구현됩니다.

  1. typedef struct _zend_ptr_stack {
  2. int top; // 스택의 현재 요소 수
  3. int max; 스택에 저장된 요소 수
  4. void **elements; // 스택 하단
  5. void **top_element; // 스택 상단
  6. } zend_ptr_stack;
코드 복사

argument_stack 초기화 Argument_stack 초기화 작업은 PHP가 특정 요청을 처리하기 전에 발생합니다. 더 정확하게 말하면 PHP 인터프리터의 시작 프로세스 중에 발생합니다.

init_executor 함수에는 다음 두 줄이 있습니다.

  1. zend_ptr_stack_init(&EG(argument_stack));
  2. zend_ptr_stack_push(&EG(argument_stack), (void *) NULL);
코드 복사

이 두 줄은 각각 EG(argument_stack)를 초기화한 다음 NULL을 푸시하는 것을 나타냅니다. EG는 전역 변수이므로 zend_ptr_stack_init가 실제로 호출되기 전에는 EG(argument_stack)의 모든 데이터가 모두 0입니다.

zend_ptr_stack_init 구현은 매우 간단합니다.

  1. ZEND_API void zend_ptr_stack_init(zend_ptr_stack *stack)
  2. {
  3. stack->top_element = stack->elements = (void **) emalloc(sizeof(void *)*PTR_STACK_BLOCK_SIZE);
  4. stack->max = PTR_STACK_BLOCK_SIZE; // 스택 크기는 64로 초기화됩니다.
  5. stack->top = 0; elements is 0
  6. }
코드 복사

argument_stack이 초기화되면 NULL이 즉시 푸시됩니다. 여기서 자세히 설명할 필요는 없습니다. 이 NULL은 실제로 의미가 없습니다.

NULL이 스택에 푸시된 후 전체 인수_스택의 실제 메모리 분포는 다음과 같습니다. PHP 매개변수 전달 원리에 대한 심층 분석

스택에 매개변수 푸시 첫 번째 NULL을 푸시한 후 다른 매개변수가 스택에 푸시되면 인수_스택에서 다음 작업이 발생합니다. 스택->맨 위 ; *(스택->top_element) = 매개변수;

간단한 PHP 코드를 사용하여 문제를 설명합니다.

  1. function foo( $str ){
  2. print_r(123);
  3. }
  4. foo("hello world");
코드 복사

위 코드는 foo를 호출할 때 문자열 상수를 전달합니다. 따라서 실제로 스택에 푸시되는 것은 저장소 "hello world"를 가리키는 zval입니다. 컴파일된 opcode를 보려면 vld를 사용하십시오.

  1. line # * op fetch ext return 피연산자
  2. ---------------------- ------------------------------------- ----------
  3. 3 0 > NOP
  4. 6 1 SEND_VAL OP1[ IS_CONST (458754) 'hello world' ]
  5. 2 DO_FCALL 1 OP1[ IS_CONST (458752) 'foo' ]
  6. 15 3 > RETURN OP1[ IS_CONST (0) 1 ]
코드 복사

SEND_VAL 명령이 실제로 수행하는 작업은 " "입니다. hello world"가 인수 스택에 푸시됩니다.

value = &opline->op1.u.constant;

ALLOC_ZVAL(valptr);
INIT_PZVAL_COPY(valptr, value);
    if (!0 ) {
  1. zval_copy_ctor(valptr);
  2. }
  3. // 스택으로 푸시하고, valptr은 hello world를 저장하는 zval을 가리킵니다.

  4. zend_ptr_stack_push(&EG(argument_stack ), valptr); ……
  5. }
  6. 코드 복사
  7. 푸시가 완료된 후의 인수_스택은 다음과 같습니다. :
  8. 매개변수 수 앞서 언급했듯이 실제로는 모든 매개변수를 스택에 푸시하는 것이 아닙니다. PHP는 또한 매개변수 수를 나타내기 위해 추가 숫자를 푸시합니다. 이 작업은 SEND_XXX 명령 중에는 발생하지 않습니다. 실제로 함수를 실제로 실행하기 전에 PHP는 여러 매개변수를 스택에 푸시합니다.
위의 예를 계속 사용하면 DO_FCALL 명령어를 사용하여 foo 함수를 호출합니다. foo를 호출하기 전에 PHP는 자동으로 인수_스택의 마지막 부분을 채웁니다.

static int zend_do_fcall_common_helper_SPEC(ZEND_OPCODE_HANDLER_ARGS)PHP 매개변수 전달 원리에 대한 심층 분석3{

// 인수_스택에 2개의 값 푸시

/ / 하나는 매개변수의 개수입니다(예: opline->extended_value)

// 하나는 스택의 상단을 식별하는 NULL입니다

zend_ptr_stack_2_push(&EG(argument_stack), (void *)(zend_uintptr_t)opline-> ;extended_value, NULL );
……
if (EX(function_state).function->type == ZEND_INTERNAL_FUNCTION) {
    ……
  1. }
  2. else if (EX(function_state) .function-> ;type == ZEND_USER_FUNCTION) {
  3. // foo 함수 호출
  4. zend_execute(EG(active_op_array) TSRMLS_CC);
  5. }
  6. else { /* ZEND_OVERLOADED_FUNCTION */
  7. … …
  8. }
  9. // 인수 스택 지우기
  10. zend_ptr_stack_clear_multiple(TSRMLS_C);
  11. ZEND_VM_NEXT_OPCODE();
  12. }
  13. 코드를 복사하고 매개변수 개수와 NULL을 푸시하면 foo 호출에 대한 전체 인수_스택이 완료되었습니다.
  14. 매개변수 가져오기 위의 예를 계속합니다. foo 함수를 살펴보고 foo의 opcode가 어떻게 생겼는지 확인하세요.
line # * op fetch ext return 피연산자---------------------- ------------------------------------- ---------- 3 0 > RECV OP1[ IS_CONST (0) 1 ]
4 1 SEND_VAL OP1[ IS_CONST (5) 123 ]

2 DO_FCALL 1 OP1[ IS_CONST ( 459027) 'print_r' ]PHP 매개변수 전달 원리에 대한 심층 분석 5 3 > RETURN OP1[ IS_CONST (0) null ]

    코드 복사
  1. 첫 번째 명령어는 RECV로, 문자 그대로 스택에서 매개변수를 가져오는 데 사용됩니다. 실제로 SEND_VAL과 RECV는 어느 정도 상응하는 느낌을 갖고 있습니다. 각 함수 호출 전에 SEND_VAL, RECV는 함수 내부에서 수행됩니다. 실제로 RECV 명령이 반드시 필요한 것은 아닙니다. RECV는 사용자 정의 함수가 호출될 때만 생성됩니다. 우리가 작성하는 확장 함수와 PHP와 함께 제공되는 내장 함수에는 RECV가 없습니다.

    각 SEND_VAL 및 RECV는 하나의 매개변수만 처리할 수 있다는 점에 유의해야 합니다. 즉, 매개변수 전달 과정에서 여러 개의 매개변수가 있는 경우 여러 개의 SEND_VAL과 여러 개의 RECV가 생성됩니다. 이는 매우 흥미로운 주제로 이어집니다. 매개변수를 전달하고 매개변수를 가져오는 순서는 무엇입니까?

    대답은 SEND_VAL이 스택에 매개변수를 왼쪽에서 오른쪽으로 푸시하는 반면, RECV는 매개변수를 왼쪽에서 오른쪽으로 가져오는 것입니다.

    1. static int ZEND_RECV_SPEC_HANDLER(ZEND_OPCODE_HANDLER_ARGS)

    2. {
    3. … // param이 매개변수를 취하는 순서는 다음과 같습니다. 스택 상단 --> 스택 하단
    4. if (zend_ptr_stack_get_arg(arg_num, (void **) ¶m TSRMLS_CC)==FAILURE) {
    5. ……
    6. } else {
    7. zend_free_op free_res;
    8. zval **var_ptr;
    9. // 매개변수 확인

    10. zend_verify_arg_type((zend_function *) EG(active_op_array), arg_num, *param TSRMLS_CC);
    11. var_ptr = get_zval_ptr_ptr (&opline ->result, EX(Ts), &free_res, BP_VAR_W);
    12. // 매개변수 가져오기
    13. if (PZVAL_IS_REF(*param)) {
    14. zend_sign_to_variable_reference(var_ptr, param TSRMLS_CC);
    15. } else {
    16. zend_receive(var_ptr, *param TSRMLS_CC);
    17. }
    18. }
    19. ZEND_VM_NEXT_OPCODE();

    20. } ;
    코드 복사

    zend_sign_to_variable_reference 및 zend_receive는 "매개변수 가져오기"를 완료합니다. "매개변수 가져오기"는 실제로 무엇을 수행하는지 이해하기 쉽지 않습니다.

    최종 분석에서는 매우 간단합니다. "매개변수 가져오기"는 현재 함수 실행 중에 이 매개변수를 "심볼 테이블"에 추가하는 것입니다. 이는 구체적으로 EG(current_execute_data)->symbol_table에 해당합니다. 이 예에서는 RECV가 완료된 후 함수 본문의 Symbol_table에 'str' 기호가 있고 해당 값은 "hello world"입니다.

    그러나 RECV는 매개변수만 읽고 스택에 유사한 팝 작업을 발생시키지 않기 때문에 인수_스택은 전혀 변경되지 않았습니다.

    PHP 매개변수 전달 원리에 대한 심층 분석5

    argument_stack 정리 foo 내부의 print_r도 함수 호출이므로 스택 푸시-->스택 지우기 작업도 발생합니다. 따라서 print_r이 실행되기 전의 인수_스택은 다음과 같습니다. PHP 매개변수 전달 원리에 대한 심층 분석6

    print_r이 실행된 후 인수_스택은 foo가 방금 RECV를 마친 상태로 돌아갑니다.

    print_r을 호출하는 특정 프로세스는 이 기사의 초점이 아닙니다. 우리가 관심을 갖는 것은 PHP가 foo를 호출한 후 인수_스택을 정리하는 방법입니다.

    위에 표시된 do_fcall 코드 조각에서 볼 수 있듯이 정리 작업은 zend_ptr_stack_clear_multiple에 의해 완료됩니다.

    1. static inline void zend_ptr_stack_clear_multiple(TSRMLS_D)
    2. {
    3. void **p = EG(argument_stack).top_element-2;
    4. / / 스택 상단에 저장된 매개변수 개수를 가져옵니다
    5. int delete_count = (int)(zend_uintptr_t) *p
    6. EG(argument_stack).top -= (delete_count 2);
    7. // 위에서 아래로 순서대로 정리
    8. while (--delete_count>=0) {
    9. zval *q = *(zval **)(--p);
    10. *p = NULL;
    11. zval_ptr_dtor( &q);
    12. }
    13. EG(argument_stack).top_element = p;
    14. }
    코드 복사

    여기서 zval_ptr_dtor를 사용하여 스택의 zval 포인터가 지워집니다. zval_ptr_dtor는 참조 횟수를 1씩 감소시킵니다. 참조 횟수가 0으로 감소하면 변수를 저장하는 메모리 영역이 실제로 재활용됩니다.

    이 기사의 예에서는 foo가 호출된 후 "hello world"의 zval 상태가 저장됩니다.

    1. 값 "hello world"
    2. refcount 1
    3. type 6
    4. is_ref 0
    코드 복사

    refcount는 1이므로 zval_ptr_dtor는 실제로 메모리에서 "hello world"를 삭제합니다.

    스택 제거 후 인수_스택의 메모리 상태는 다음과 같습니다.

    PHP 매개변수 전달 원리에 대한 심층 분석7

    위 그림의 인수_스택이 방금 초기화된 것과 동일한 것을 볼 수 있습니다. 이 시점에서 인수_스택은 다음 함수 호출을 위한 준비가 되었습니다.

    글 시작 부분의 질문으로 돌아가서... 왜 free(str)가 필요하지 않나요? Argument_Stack을 이해하고 나면 이 문제를 쉽게 이해할 수 있습니다.

    str은 "hello world"가 실제로 zval에 저장된 메모리 주소를 가리키기 때문입니다. 확장 기능은 다음과 같다고 가정합니다.

    1. PHP_FUNCTION(테스트)

    2. {
    3. char* str;
    4. int str_len;> ;
    5. if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &str, &str_len) == FAILURE) {

    6. RETURN_FALSE;
    7. }
    8. }

    코드 복사

    1. $a = "hello world";
    2. test($a);
    3. echo $a;
    코드를 복사하면

    "Hello world"가 출력됩니다. test를 호출할 때 $a의 참조를 전달하지 않지만 실제 효과는 test(&$a)와 동일합니다.

    간단히 말하면 CV 배열이든 인수_스택이든 메모리에는 $a의 복사본이 하나만 있습니다. zend_parse_parameters는 함수 실행을 위해 데이터 복사본을 복사하지 않으며 실제로 복사할 수도 없습니다. 따라서 함수가 완료되었을 때 $a가 다른 곳에서 사용되지 않으면 PHP는 인수_스택을 정리할 때 이를 해제하는 데 도움을 줍니다. 여전히 다른 코드에서 사용 중이라면 수동으로 해제할 수 없습니다. 그렇지 않으면 $a의 메모리 영역이 파괴됩니다.

    확장 함수 작성에 사용된 모든 변수가 PHP에서 자동으로 재활용되는 것은 아닙니다. 그러니 자유로워질 때, 부드러워지지 마세요 :)



성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.