이 글은 주로 PHP의 OpCode 원리를 소개하고, 관련 컴파일 메커니즘과 PHP 프로그램의 작동 원리를 좀 더 자세히 분석합니다. 도움이 필요한 친구들은 참고할 수 있습니다.
OpCode는 Java ByteCode와 마찬가지로 PHP 스크립트로 컴파일된 중간 언어입니다. 또는 .NET의 MSL입니다. 이 글은 주로 "OPcode의 이해"와 인터넷을 기반으로 개인적인 이해와 수정을 바탕으로 기록되었습니다.
PHP 코드:
<?php echo "Hello World"; $a = 1 + 1; echo $a; ?>
PHP는 이 코드를 실행하기 위해 다음 4단계를 거칩니다.
1. 스캔(렉싱), PHP 코드를 언어 조각(토큰)으로 변환
2. 토큰을 간단하고 의미 있는 표현식으로 변환
3. 컴파일, 표현식을 Opocdes로 컴파일
4. PHP 스크립트의 기능을 구현하는 시간입니다.
참고: APC와 같은 일부 현재 캐시는 PHP가 Opcode를 캐시하도록 할 수 있습니다. 이러한 방식으로 요청이 올 때마다 처음 세 단계를 반복할 필요가 없으므로 PHP의 실행 속도가 크게 향상될 수 있습니다.
먼저 Zend/zend_언어_scanner.c는 Zend/zend_언어_scanner.l(Lex 파일)을 기반으로 입력 PHP 코드에 대한 어휘 분석을 수행하여 "단어"를 하나씩 얻습니다. PHP4.2+에서는 token_get_all이라는 함수를 제공하기 시작합니다. 이 함수는 PHP 코드 조각을 토큰으로 스캔할 수 있습니다.
다음 결과를 얻습니다.
Array ( [0] => Array ( [0] => 367 [1] => <?php [2] => 1 ) [1] => Array ( [0] => 370 [1] => [2] => 2 ) [2] => Array ( [0] => 316 [1] => echo [2] => 2 ) [3] => Array ( [0] => 370 [1] => [2] => 2 ) [4] => Array ( [0] => 315 [1] => "Hello World" [2] => 2 ) [5] => ; [6] => Array ( [0] => 370 [1] => [2] => 2 ) [7] => Array ( [0] => 309 [1] => $a [2] => 3 ) [8] => Array ( [0] => 370 [1] => [2] => 3 ) [9] => = [10] => Array ( [0] => 370 [1] => [2] => 3 ) [11] => Array ( [0] => 305 [1] => 1 [2] => 3 ) [12] => Array ( [0] => 370 [1] => [2] => 3 ) [13] => + [14] => Array ( [0] => 370 [1] => [2] => 3 ) [15] => Array ( [0] => 305 [1] => 1 [2] => 3 ) [16] => ; [17] => Array ( [0] => 370 [1] => [2] => 3 ) [18] => Array ( [0] => 316 [1] => echo [2] => 4 ) [19] => Array ( [0] => 370 [1] => [2] => 4 ) [20] => Array ( [0] => 309 [1] => $a [2] => 4 ) [21] => ; [22] => Array ( [0] => 370 [1] => [2] => 4 ) [23] => Array ( [0] => 369 [1] => ?> [2] => 5 ) )
반환된 결과, 소스 코드의 문자열, 문자 및 공백은 변경되지 않습니다. 반품. 각 소스 코드의 문자는 해당 순서로 나타납니다. 그러나 태그, 연산자, 명령문과 같은 다른 항목은 토큰 ID(즉, T_ECHO, T_STRING과 같이 Zend 내부에서 토큰을 변경하기 위한 해당 코드)와 원본 코드의 두 부분을 포함하는 배열로 변환됩니다. 소스 코드 내용.
다음 단계는 파싱 단계입니다. 먼저 토큰 배열에서 남은 공백을 삭제한 다음 남은 토큰을 하나씩 간단한 표현식으로 변환합니다.
1. 두 개의 숫자를 함께 추가합니다. 3. 이전 표현식의 결과를 변수에 저장합니다
4. 변수를 에코합니다
그런 다음 토큰을 op_array로 하나씩 컴파일합니다.
1. Opcode 번호의 식별은 add, echo
2와 같은 각 op_array의 연산 유형을 나타냅니다. 결과는 Opcode 결과3를 저장합니다. Operand 1은 Opcode
4 확장 값 1입니다. 은 오버로드된 연산자를 구별하는 데 사용되는 정수입니다.
예를 들어, PHP 코드는 다음과 같이 구문 분석됩니다.
[root@localhost html]# /usr/local/php/bin/php -dvld.active=1 hello.php Branch analysis from position: 0 Return found filename: /var/www/html/hello.php function name: (null) number of ops: 6 compiled vars: !0 = $a line # op fetch ext return operands ------------------------------------------------------------------------------- 2 0 ECHO 'Hello+world' 3 1 ADD ~0 1, 1 2 ASSIGN !0, ~0 4 3 ECHO !0 6 4 RETURN 1 5* ZEND_HANDLE_EXCEPTION Hello world2각 피연산자는 다음 두 부분으로 구성됩니다. a) op_type: IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED 또는 IS_CVb) u, 공용체는 op_type에 따라 피연산자의 값(const) 또는 lvalue(var)를 다른 유형으로 저장합니다. IS_TMP_VAR은 이름에서 알 수 있듯이 다음 op_array에서 사용하기 위해 op_array의 일부 결과를 저장하는 임시 변수입니다. 이 유형의 피연산자의 u는 일반적으로 변수 테이블을 가리키는 핸들(정수)을 저장합니다. 사용됨~ ~0과 같은 시작은 변수 테이블의 0번에 있는 알 수 없는 임시 변수 IS_VAR을 나타냅니다. 이것은 ZE2.1/ 이후 컴파일러에서 사용되는 유형을 나타내는 IS_CV를 나타 내기 위해 $로 시작합니다. PHP5.1 캐시 메커니즘에서는 이 변수가 참조하는 변수의 주소를 저장합니다. 변수가 처음 참조되면 이 변수에 대한 후속 참조는 활성 기호 테이블을 다시 찾을 필요가 없습니다. . CV 변수는 !로 시작하여 표시됩니다. $a 변수는 !0에 최적화되어 있습니다. 요약: 위 내용은 이 글의 전체 내용입니다. 모든 분들의 공부에 도움이 되었으면 좋겠습니다. 관련 권장 사항:
동시성에서 코드 캡처 기능을 구현하기 위해 잠금을 사용하는 PHP 기반 방법
구현된 4가지 기본 정렬 알고리즘의 실행 시간 비교 PHP로 (필독)
위 내용은 PHP의 OpCode 원리에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!