집 >백엔드 개발 >PHP 튜토리얼 >PHP의 작동 메커니즘 및 원리(하위 계층)

PHP의 작동 메커니즘 및 원리(하위 계층)

不言원래의: 2018-04-08 10:21:291789검색

php는 매우 단순해 보이지만, PHP의 작동 메커니즘과 원리를 깊이 파고드는 것은 쉽지 않습니다. PHP를 사용할 수 있을 뿐만 아니라, PHP를 유연하게 사용할 수 있도록 기본 작동 원리도 알아야 합니다. PHP의 작동 메커니즘에 관심을 갖고 함께 배워봅시다

PHP의 작동 메커니즘에 대해 먼저 PHP 모듈을 소개하겠습니다. PHP에는 커널, Zend 엔진, 확장 레이어라는 총 세 가지 모듈이 있습니다. PHP 커널은 요청, 파일 스트림 및 오류 처리 및 기타 관련 작업을 처리하는 데 사용되며 ZE(Zend Engine)는 소스 파일을 기계 언어로 변환한 다음 이를 가상 머신에서 실행하는 데 사용됩니다. PHP가 특정 작업을 수행하는 데 사용하는 함수, 클래스 라이브러리 및 스트림. 예를 들어, MySQL 데이터베이스에 연결하려면 mysql 확장이 필요합니다. ZE가 프로그램을 실행할 때 여러 확장에 연결해야 할 수도 있습니다. 이때 ZE는 제어권을 확장에 넘겨준 다음 처리 후 반환합니다.

마지막으로 ZE가 프로그램을 실행합니다. 결과는 PHP 코어로 반환되며, 그 결과는 SAPI 레이어로 전송되고 최종적으로 브라우저로 출력됩니다.

PHP는 간단하다고 하지만 마스터하기는 쉽지 않습니다. 이를 사용할 수 있는 것 외에도 기본 작동 원리도 알아야 합니다.

PHP는 웹 개발에 적합한 동적 언어입니다. 좀 더 구체적으로 말하자면, C 언어를 사용하여 수많은 구성 요소를 구현하는 소프트웨어 프레임워크입니다. 좀 더 좁은 의미에서는 강력한 UI 프레임워크로 간주할 수 있습니다.

PHP의 기본 구현을 이해하는 목적은 무엇입니까? 동적 언어를 잘 사용하려면 먼저 이를 이해해야 합니다. 메모리 관리 및 프레임워크 모델은 확장된 개발을 통해 더욱 강력한 기능을 구현하고 프로그램 성능을 최적화할 수 있습니다.

1. PHP의 설계 개념 및 특징

다중 프로세스 모델: PHP는 다중 프로세스 모델이므로 서로 다른 요청이 서로 간섭하지 않으므로 하나의 요청이 실패해도 작업에 영향을 미치지 않습니다. 물론, 시대의 발전에 따라 PHP는 이미 멀티스레딩 모델을 지원하고 있습니다.

약한 유형의 언어: C/C++, Java, C# 및 기타 언어와 달리 PHP는 약한 유형의 언어입니다. 변수의 유형은 처음에 결정되지 않으며, 암시적 또는 명시적 유형 변환이 발생할 수 있습니다. 이 메커니즘의 유연성은 나중에 PHP에서 논의됩니다. 에 자세히 나와 있습니다.

엔진(Zend) + 컴포넌트(ext) 모드는 내부 결합을 줄여줍니다.

중간 계층(sapi)은 웹 서버와 PHP를 분리합니다.

구문은 너무 많은 사양 없이 간단하고 유연합니다. 단점은 혼합된 스타일로 이어지지만, 아무리 나쁜 프로그래머라도 그는 너무 터무니없고 전체 상황을 위험에 빠뜨리는 프로그램을 작성하지 않을 것입니다.

2. PHP의 4계층 시스템

PHP의 핵심 아키텍처는 다음과 같습니다.

그림에서 볼 수 있듯이 PHP는 아래에서 위로 4계층 시스템입니다.

Zend 엔진: Zend 전체 순수 C로 구현되었으며 PHP의 핵심 부분입니다. PHP 코드(어휘 및 구문 분석과 같은 일련의 컴파일 프로세스)를 실행 가능한 opcode 처리로 변환하고 해당 처리 방법을 구현하며 기본 데이터 구조를 구현합니다. (예: 해시테이블, oo), 메모리 할당 및 관리, 외부 호출에 대한 해당 API 메소드 제공 모든 주변 기능이 Zend를 중심으로 구현됩니다.

확장: Zend 엔진을 중심으로 다양한 기본 서비스를 컴포넌트 기반 방식으로 제공합니다. 우리가 흔히 사용하는 다양한 내장 기능(예: 배열 시리즈), 표준 라이브러리 등은 모두 확장을 통해 구현되며 사용자도 이를 수행할 수 있습니다. 필요에 따라 구현하십시오. 기능 확장, 성능 최적화 및 기타 목적을 달성하려면 자체 확장을 사용하십시오. 예를 들어 현재 Tieba에서 사용하는 PHP 중간 계층 및 서식 있는 텍스트 구문 분석은 확장의 일반적인 응용 프로그램입니다.

Sapi: Sapi의 전체 이름은 서버 응용 프로그래밍 인터페이스인 서버 응용 프로그래밍 인터페이스입니다. Sapi는 일련의 후크 기능을 사용하여 PHP가 주변 데이터와 상호 작용할 수 있도록 합니다. 이는 매우 우아하고 성공적인 PHP 설계입니다. 이는 sapi를 통해 성공적으로 달성되었습니다. PHP 자체를 상위 계층 응용 프로그램과 분리하고 격리함으로써 PHP는 더 이상 다른 응용 프로그램과 호환되는 방법을 고려할 수 없으며 응용 프로그램 자체도 자체 특성에 따라 다른 처리 방법을 구현할 수 있습니다.

상위 계층 애플리케이션: 이것은 우리가 일반적으로 작성하는 PHP 프로그램입니다. 웹 서버를 통해 웹 애플리케이션을 구현하거나 명령줄에서 스크립트 모드로 실행하는 등 다양한 sapi 방법을 통해 다양한 애플리케이션 모드를 얻습니다.

PHP가 자동차라면 자동차의 프레임은 PHP 그 자체이고, Zend는 자동차의 엔진이며, Ext 아래의 다양한 구성요소는 자동차의 바퀴, Sapi는 자동차라고 볼 수 있습니다. 도로에서 다양한 유형의 도로를 달릴 수 있으며 PHP 프로그램의 실행은 도로를 달리는 자동차입니다. 따라서 우리에게는 고성능 엔진 + 올바른 바퀴 + 올바른 트랙이 필요합니다.

3. Sapi

앞서 언급했듯이 Sapi를 사용하면 외부 애플리케이션이 일련의 인터페이스를 통해 PHP와 데이터를 교환하고 다양한 애플리케이션 특성에 따라 특정 처리 방법을 구현할 수 있습니다.

apache2handler: Apache를 웹서버로 사용하고 mod_PHP 모드에서 실행할 때 처리하는 방법이기도 하며 현재 가장 널리 사용되는 방법이기도 합니다.

cgi: 이것은 유명한 fastcgi 프로토콜인 PHP와 웹서버 사이의 또 다른 직접 상호작용 방식입니다. 최근에는 fastcgi+PHP가 점점 더 많이 사용되고 있으며, 비동기식 웹서버에서 지원하는 유일한 방식이기도 합니다.

cli: 명령줄 호출을 위한 애플리케이션 모드

4. PHP 실행 프로세스 및 opcode

먼저 PHP 코드를 실행하는 프로세스를 살펴보겠습니다.

그림에서 볼 수 있듯이 PHP는 일반적인 동적 언어 실행 프로세스를 구현합니다. 코드 조각을 가져온 후 어휘 분석, 구문 분석 및 기타 단계를 거친 후 소스 프로그램이 명령어(opcode)로 변환됩니다. ), 그런 다음 ZEND 가상 머신은 이러한 명령을 순서대로 실행하여 작업을 완료합니다. PHP 자체는 C로 구현되어 있으므로 최종적으로 호출되는 함수는 모두 C 함수입니다. 사실 PHP는 C로 개발된 소프트웨어라고 볼 수 있습니다.

PHP 실행의 핵심은 번역된 명령, 즉 opcode입니다.

Opcode는 PHP 프로그램 실행의 가장 기본적인 단위입니다. Opcode는 두 개의 매개변수(op1, op2), 반환 값 및 처리 기능으로 구성됩니다. PHP 프로그램은 궁극적으로 일련의 opcode 처리 기능의 순차적 실행으로 변환됩니다.

몇 가지 공통 처리 함수:

ZEND_ASSIGN_SPEC_CV_CV_HANDLER: 변수 할당($a=$b)

ZEND_DO_FCALL_BY_NAME_SPEC_HANDLER: 함수 호출

ZEND_CONCAT_SPEC_CV_CV_HANDLER: 문자열 접합 $a.$ b

Z END_ADD_SPEC_CV_CONST_HANDLER: 추가 연산 $a+2

ZEND_IS_EQUAL_SPEC_CV_CONST: 판사 평등 $a==1

ZEND_IS_IDENTICAL_SPEC_CV_CONST: 판사 평등 $a===1

5 HashTable - 핵심 데이터 구조

HashTable은 zend의 핵심 데이터 구조이며 PHP에서 거의 사용됩니다. 우리가 알고 있는 모든 일반적인 함수는 PHP 배열의 일반적인 응용 프로그램입니다. 또한 zend 내에서는 함수 기호 테이블, 전역 변수 등도 해시 테이블을 기반으로 구현됩니다.

PHP의 해시 테이블에는 다음 기능이 있습니다.

일반적인 키->값 쿼리 지원

배열로 사용 가능

노드 추가 및 삭제는 O(1) 복잡성

키는 혼합 유형을 지원합니다. 동시에 배열 조합 인덱스 배열

값은 혼합 유형을 지원합니다: 배열("문자열", 2332)

선형 순회를 지원합니다: foreach

Zend 해시 테이블은 일반적인 해시 테이블 해시 구조를 구현하는 동시에 다음을 제공합니다. 이를 추가하여 이중 연결 리스트 배열을 순방향 및 역방향으로 순회하는 기능을 갖습니다. 그 구조는 아래와 같습니다.

보시다시피 해시 테이블에는 키->값 형태의 해시 구조와 이중 연결 리스트 모드가 모두 있어 빠른 검색과 선형을 지원하는 데 매우 편리합니다. 순회.

해시 구조: Zend의 해시 구조는 연결 목록을 통해 충돌을 해결하는 일반적인 해시 테이블 모델입니다. zend의 해시 테이블은 자체 성장하는 데이터 구조라는 점에 유의해야 합니다. 해시 테이블 수가 가득 차면 동적으로 2배로 확장되고 요소의 위치가 변경됩니다. 초기 크기는 8입니다. 또한, 키->값 빠른 검색을 수행할 때 zend 자체도 공간을 시간과 교환하여 프로세스 속도를 높이기 위해 일부 최적화를 수행했습니다. 예를 들어, 빠른 결정을 위해 키 길이를 식별하기 위해 각 요소에서 nKeyLength 변수가 사용됩니다.

이중 연결 목록: Zend 해시 테이블은 연결 목록 구조를 통해 요소의 선형 순회를 구현합니다. 이론적으로는 순회를 위해 단방향 연결 목록을 사용하는 것으로 충분합니다. 양방향 연결 목록을 사용하는 주요 목적은 순회를 빠르게 삭제하고 방지하는 것입니다. Zend 해시 테이블은 배열로 사용될 때 일반적인 연관 배열을 지원하고 순차 인덱스 번호로 사용될 수도 있으며 둘을 혼합하는 것도 허용합니다.

PHP 연관 배열: 연관 배열은 일반적인 hash_table 애플리케이션입니다. 쿼리 프로세스는 다음 단계를 거칩니다. (코드에서 볼 수 있듯이 이는 검색 속도를 높이기 위해 몇 가지 빠른 판단이 추가된 일반적인 해시 쿼리 프로세스입니다.):

getKeyHashValue h;
index = n & nTableMask;
Bucket *p = arBucket[index];
while (p) {
  if ((p->h == h) & (p->nKeyLength == nKeyLength)) {
    RETURN p->data; 
  }
  p=p->next;
}

PHP 인덱스 배열: 인덱스 array는 아래 첨자를 통해 액세스되는 공통 배열입니다. 예를 들어 $arr[0]의 경우 Zend HashTable은 내부적으로 정규화되며 인덱스 유형 키에도 해시 값과 nKeyLength(0)가 할당됩니다. 내부 멤버 변수 nNextFreeElement는 현재 할당된 최대 ID이며, 푸시할 때마다 자동으로 1씩 증가합니다. PHP가 연관 데이터와 비연관 데이터의 혼합을 달성할 수 있게 하는 것은 바로 이 정규화 프로세스입니다. 푸시 작업의 특수성으로 인해 PHP 배열의 인덱스 키 순서는 아래 첨자의 크기가 아니라 푸시 순서에 따라 결정됩니다. 예를 들어 $arr[1] = 2; $arr[2] = 3; Zend HashTable은 이를 인덱스 키로 처리합니다

6. PHP 변수는 약한 유형의 언어입니다. 변수 자체의 유형은 엄격하게 구별되지 않습니다. PHP는 변수를 선언할 때 유형을 지정할 필요가 없습니다. PHP는 프로그램 실행 중에 변수 유형의 암시적 변환을 수행할 수 있습니다. 다른 강력한 형식의 언어와 마찬가지로 프로그램에서 명시적인 형식 변환도 수행할 수 있습니다. PHP 변수는 단순 유형(int, string, bool), 컬렉션 유형(배열 자원 객체) 및 상수(const)로 나눌 수 있습니다. 위의 모든 변수는 내부적으로 동일한 구조 zval을 갖습니다.

Zval은 PHP 변수를 식별하고 구현하는 데 사용되는 zend의 또 다른 매우 중요한 데이터 구조입니다.

Zval은 주로 세 부분으로 구성됩니다.

type: 변수의 유형을 지정합니다(정수, 문자열, 배열 등).

refcount&is_ref: 참조 카운팅을 구현하는 데 사용됩니다(자세한 내용은 나중에 설명).

value : 핵심 부분, 변수의 실제 데이터를 저장합니다.

Z값은 변수의 실제 데이터를 저장하는 데 사용됩니다. 여러 유형을 저장해야 하기 때문에 zvalue는 공용체이므로 약한 유형 지정을 구현합니다.

PHP 변수 유형과 실제 저장 간의 해당 관계는 다음과 같습니다.

IS_LONG -> dvalue
IS_ARRAY -> 메모리의 참조 계산 재활용, 문자열 작업 및 기타 장소에서 널리 사용됩니다. PHP의 변수는 참조 카운팅의 일반적인 응용 프로그램입니다. Zval의 참조 카운팅은 멤버 변수 is_ref 및 ref_count를 통해 구현됩니다. 참조 카운팅을 통해 여러 변수가 동일한 데이터를 공유할 수 있습니다. 잦은 복사로 인한 과도한 소비를 피하세요.

할당 작업을 수행할 때 zend는 변수를 동일한 zval 및 ref_count++로 가리키고, 설정 해제 작업 중에는 해당 ref_count-1을 가리킵니다. 소멸 작업은 ref_count가 0으로 감소된 경우에만 수행됩니다. 참조 할당인 경우 zend는 is_ref를 1로 수정합니다.

PHP 변수는 참조 카운팅을 통해 변수 공유 데이터를 구현하는데, 변수 중 하나의 값을 변경하면 어떻게 될까요? 변수를 작성하려고 할 때 Zend가 변수가 가리키는 zval이 여러 변수에 의해 공유되는 것을 발견하면 ref_count가 1인 zval을 복사하고 원래 zval의 refcount를 감소시킵니다. 이 프로세스를 "zval 분리"라고 합니다. ". zend는 쓰기 작업이 발생할 때만 복사 작업을 수행하므로 쓰기 중 복사라고도 함을 알 수 있습니다. 참조 변수의 경우 요구 사항이 참조로 할당된 변수와 반대입니다. 하나의 변수를 수정하면 모든 번들 변수가 수정됩니다.

정수와 부동 소수점 숫자는 PHP의 기본 유형 중 하나이며 간단한 변수이기도 합니다. 정수 및 부동 소수점 숫자의 경우 해당 값은 zvalue에 직접 저장됩니다. 해당 유형은 각각 long과 double입니다.

정수 유형의 경우 C와 같은 강력한 유형의 언어와 달리 PHP는 int, unsigned int, long, long long 및 기타 유형을 구분하지 않는다는 것을 zvalue 구조에서 볼 수 있습니다. 정수 유형입니다. 이를 통해 PHP에서 정수의 값 범위는 컴파일러 비트 수에 따라 결정되며 고정되지 않음을 알 수 있습니다.

정수와 마찬가지로 부동 소수점 숫자의 경우 float와 double을 구분하지 않고 double만 구분합니다.

PHP에서 정수 범위가 범위를 벗어나면 어떻게 해야 하나요? 이 경우 자동으로 double형으로 변환되므로 이로 인해 많은 트릭이 발생하므로 주의해야 합니다.

정수와 마찬가지로 문자 변수도 PHP의 기본 유형이자 단순 변수입니다. PHP의 문자열은 실제 데이터에 대한 포인터와 C++의 문자열과 유사한 길이 구조로 구성된다는 것을 zvalue 구조에서 볼 수 있습니다. 길이는 c와 달리 실제 변수로 표시되므로 해당 문자열은 이진 데이터(포함)일 수 있습니다. 동시에 PHP에서 문자열 길이 strlen을 찾는 것은 O(1) 작업입니다.

문자열 작업을 추가, 수정 또는 추가할 때 PHP는 메모리를 재할당하여 새 문자열을 생성합니다. 마지막으로 보안상의 이유로 PHP는 문자열을 생성할 때 마지막에

일반적인 문자열 접합 방법과 속도 비교를 추가합니다.

다음 4개의 변수가 있다고 가정합니다: $strA='123'; ; $intA=123; intB=456;

이제 다음 문자열 접합 방법을 비교하고 설명하겠습니다.

$res = $strA.$strB 및 $res = “$strA$strB”

이 경우 zend는 메모리 조각을 다시 malloc하고 이에 따라 처리합니다. 속도는 일반적으로

$strA = $strA.$strB

이것이 가장 빠릅니다. zend는 반복 복사를 피하기 위해 현재 strA를 기반으로 직접 relloc합니다.

$res = $intA.$intB

암묵적인 형식 변환이 필요하기 때문에 속도가 느려집니다. 실제 작성 시

$strA = sprintf (“%s %s",$strA.$ strB);

sprintf는 PHP의 언어 구조가 아니며 형식을 인식하고 처리하는 데 많은 시간이 걸리기 때문에 가장 느린 방법입니다. 또한 자체 메커니즘인 malloc도 있습니다. 그러나 sprintf 방법이 가장 읽기 쉽고 실제로는 특정 상황에 따라 유연하게 선택할 수 있습니다.

PHP 배열은 Zend HashTable을 통해 자연스럽게 구현됩니다.

foreach 작업을 구현하는 방법은 무엇입니까? 배열의 Foreach는 해시 테이블의 이중 연결 목록을 탐색하여 완료됩니다. 인덱스 배열의 경우 foreach를 통한 순회는 foreach보다 훨씬 효율적이므로 키->값을 검색할 필요가 없습니다. count 연산은 HashTable->NumOfElements, O(1) 연산을 직접 호출합니다. '123'과 같은 문자열의 경우 zend는 이를 정수 형식으로 변환합니다. $arr['123'] 및 $arr[123]은 동일합니다.

리소스 유형 변수는 PHP에서 가장 복잡한 변수이며 복합 구조이기도 합니다.

PHP의 zval은 광범위한 데이터 유형을 나타낼 수 있지만 사용자 정의 데이터 유형을 완전히 설명하기는 어렵습니다. 이러한 복합 구조를 나타내는 효율적인 방법이 없기 때문에 기존 연산자를 사용할 방법이 없습니다. 이 문제를 해결하려면 리소스라고 하는 본질적으로 임의의 식별자(레이블)를 통해 포인터를 참조하기만 하면 됩니다.

zval에서는 리소스의 경우 lval이 리소스의 주소를 직접 가리키는 포인터로 사용됩니다. 리소스는 임의의 복합 구조일 수 있습니다. 친숙한 mysqli, fsock, memcached 등은 모두 리소스입니다.

리소스 사용 방법:

등록: 사용자 정의 데이터 유형의 경우 이를 리소스로 사용하려고 합니다. 먼저 이를 등록해야 하며, zend는 전역적으로 고유한 식별자를 할당합니다.

리소스 변수 가져오기: 리소스의 경우 zend는 실제 데이터의 id->hash_tale을 유지합니다. 리소스의 경우 해당 ID만 zval에 기록됩니다. 가져올 때 id를 통해 hash_table에서 특정 값을 찾아서 반환합니다.

자원 파괴: 자원의 데이터 유형은 다양합니다. Zend 자체는 그것을 파괴할 방법이 없습니다. 따라서 사용자는 리소스 등록 시 파기 기능을 제공해야 합니다. 리소스를 설정 해제하면 zend는 해당 함수를 호출하여 파기를 완료합니다. 또한 전역 리소스 테이블에서도 삭제합니다.

리소스를 참조하는 모든 변수가 범위를 벗어난 후뿐만 아니라 요청이 종료되고 새 요청이 생성된 후에도 리소스는 오랫동안 지속될 수 있습니다. 이러한 리소스는 특별히 파기하지 않는 한 SAPI의 수명 주기 내내 유지되므로 영구 리소스라고 합니다. 많은 경우 영구 리소스는 성능을 어느 정도 향상시킬 수 있습니다. 예를 들어, 일반적인 mysql_pconnect에서 영구 리소스는 pemalloc을 통해 메모리를 할당하므로 요청이 끝날 때 해제되지 않습니다.

zend의 경우 둘 사이에 차이가 없습니다.

PHP에서는 지역 변수와 전역 변수가 어떻게 구현되나요? 요청에 대해 PHP는 언제든지 두 개의 기호 테이블(symbol_table 및 active_symbol_table)을 볼 수 있으며 전자는 전역 변수를 유지하는 데 사용됩니다. 후자는 현재 활성화된 변수 기호 테이블을 가리키는 포인터입니다. 프로그램이 함수에 들어가면 zend는 기호 테이블 x를 여기에 할당하고 active_symbol_table을 a를 가리킵니다. 이러한 방식으로 전역 변수와 지역 변수의 구별이 이루어집니다.

변수 값 가져오기: PHP의 기호 테이블은 hash_table을 통해 구현됩니다. 각 변수에는 고유 식별자가 할당됩니다. 가져오면 해당 식별자에 따라 테이블에서 해당 zval을 찾아 반환합니다.

함수에서 전역 변수 사용: 함수에서는 global을 명시적으로 선언하여 전역 변수를 사용할 수 있습니다. active_symbol_table에 같은 이름의 변수에 대한 참조를 생성합니다. Symbol_table에 같은 이름의 변수가 없으면 먼저 생성됩니다.

PHP의 작동 메커니즘 및 원리(하위 계층)

관련 기사