>  기사  >  백엔드 개발  >  PHP의 기본 운영 메커니즘 및 원리

PHP의 기본 운영 메커니즘 및 원리

巴扎黑
巴扎黑원래의
2016-11-10 09:28:391459검색

PHP는 간단하다고 하지만 마스터하기는 쉽지 않습니다. 이를 사용할 수 있는 것 외에도 기본 작동 원리도 알아야 합니다.

PHP는 웹 개발에 적합한 동적 언어입니다. 좀 더 구체적으로 말하자면, C 언어를 사용하여 수많은 구성 요소를 구현하는 소프트웨어 프레임워크입니다. 좀 더 좁은 의미에서는 강력한 UI 프레임워크로 간주할 수 있습니다.

PHP의 기본 구현을 이해하는 목적은 무엇입니까? 동적 언어를 잘 사용하려면 먼저 이를 이해해야 합니다. 메모리 관리 및 프레임워크 모델은 확장된 개발을 통해 더 강력한 기능을 구현하고 프로그램 성능을 최적화할 수 있습니다.

1. PHP의 설계 개념 및 특징

다중 프로세스 모델: PHP는 다중 프로세스 모델이므로 서로 다른 요청이 서로 간섭하지 않으므로 하나의 요청이 실패하더라도 물론, 시대의 발전에 따라 PHP는 이미 멀티스레딩 모델을 지원하고 있습니다.

약한 유형의 언어: C/C++, Java, C# 및 기타 언어와 달리 PHP는 약한 유형의 언어입니다. 변수의 유형은 처음에 결정되지 않으며, 암시적 또는 명시적 유형 변환이 발생할 수 있습니다. 이 메커니즘의 유연성은 나중에 PHP에서 논의됩니다. 에 자세히 나와 있습니다.

엔진(Zend) + 컴포넌트(ext) 모드로 내부 커플링을 줄여줍니다.

중간 계층(sapi)은 웹 서버와 PHP를 분리합니다.

구문은 너무 많은 사양 없이 간단하고 유연합니다. 단점은 혼합된 스타일로 이어지지만, 아무리 나쁜 프로그래머라도 그는 너무 터무니없고 전체 상황을 위험에 빠뜨리는 프로그램을 작성하지 않을 것입니다.

2. PHP의 4계층 시스템

PHP의 핵심 아키텍처는 아래와 같습니다.

PHP의 기본 운영 메커니즘 및 원리

그렇습니다. 그림에서 볼 수 있듯이 PHP는 아래에서 위로 4계층 시스템입니다.

Zend 엔진: Zend는 완전히 순수 C로 구현되었으며 PHP의 핵심 부분입니다. PHP 코드(어휘, 구문 분석)를 번역합니다. 및 기타 컴파일 프로세스) 실행 가능한 opcode를 처리하고 해당 처리 방법을 구현하며 기본 데이터 구조(예: 해시 테이블, oo), 메모리 할당 및 관리를 구현하고 외부 호출에 해당 API 방법을 제공합니다. 모든 것과 모든 주변 장치의 핵심입니다. 모든 기능은 Zend를 중심으로 구현되었습니다.

Extensions : Zend 엔진을 중심으로 다양한 기본 서비스를 컴포넌트 기반으로 제공하는 우리 공통의 다양한 내장 기능(어레이 시리즈 등), 표준 라이브러리 등이 모두 Extension을 통해 구현됩니다. 사용자 또한 기능 확장, 성능 ​​최적화 및 기타 목적을 달성하기 위해 필요에 따라 자신만의 확장을 구현할 수 있습니다(예를 들어 현재 Tieba에서 사용하는 PHP 중간 계층 및 서식 있는 텍스트 구문 분석은 확장의 일반적인 응용 프로그램입니다).

Sapi: Sapi의 전체 이름은 서버 애플리케이션 프로그래밍 인터페이스입니다. Sapi는 일련의 후크 기능을 통해 PHP가 주변 데이터와 상호 작용할 수 있게 해줍니다. 이것은 매우 우아하고 성공적인 디자인입니다. sapi를 통해 PHP 자체는 상위 계층 애플리케이션에서 성공적으로 분리 및 격리되었습니다. PHP는 더 이상 다른 애플리케이션과 호환되는 방법을 고려할 수 없으며 애플리케이션 자체도 자체 특성에 따라 다른 처리 방법을 구현할 수 있습니다.

상위 계층 애플리케이션: 이것은 우리가 일반적으로 작성하는 PHP 프로그램입니다. 웹 서버를 통해 웹 애플리케이션을 구현하거나 명령줄에서 스크립트 모드로 실행하는 등 다양한 sapi 방법을 통해 다양한 애플리케이션 모드를 얻을 수 있습니다. .

PHP가 자동차라면 자동차의 프레임은 PHP 그 자체이고, Zend는 자동차의 엔진(엔진)이며, Ext 아래의 다양한 구성요소는 자동차의 바퀴라고 볼 수 있습니다. 자동차는 다양한 유형의 도로를 달릴 수 있으며, PHP 프로그램의 실행은 자동차가 도로를 달리는 것과 같습니다. 따라서 우리에게는 고성능 엔진 + 올바른 바퀴 + 올바른 트랙이 필요합니다.

3. Sapi

위에서 언급했듯이 Sapi는 일련의 인터페이스를 통해 외부 애플리케이션이 PHP와 데이터를 교환하고 다양한 애플리케이션 특성에 따라 특정 처리 방법을 구현할 수 있도록 합니다. sapis는 다음과 같습니다.

apache2handler: Apache를 웹서버로 사용하고 mod_PHP 모드에서 실행할 때의 처리 방법이기도 하며 현재 가장 널리 사용되는 방법이기도 합니다.

cgi: 이것은 유명한 fastcgi 프로토콜인 PHP와 웹서버 사이의 또 다른 직접 상호 작용 방법으로, 최근에는 fastcgi+PHP가 점점 더 많이 사용되고 있으며, 비동기식으로 지원되는 유일한 방법이기도 합니다. 웹서버.

cli: 명령줄 호출을 위한 애플리케이션 모드

4. PHP 실행 프로세스 &opcode

먼저 PHP 코드를 실행하는 프로세스를 살펴보겠습니다.

PHP의 기본 운영 메커니즘 및 원리

그림에서 볼 수 있듯이 PHP는 일반적인 동적 언어 실행 프로세스를 구현합니다. 코드 조각을 얻은 후 어휘 분석을 거칩니다. , 문법 구문 분석 및 기타 단계 후에 소스 프로그램은 명령(opcode)으로 변환되고 ZEND 가상 머신은 이러한 명령을 순서대로 실행하여 작업을 완료합니다. PHP 자체는 C로 구현되어 있으므로 최종적으로 호출되는 함수는 모두 C 함수입니다. 사실 PHP는 C로 개발된 소프트웨어라고 볼 수 있습니다.

PHP 실행의 핵심은 번역된 명령어, 즉 opcode입니다.

Opcode는 PHP 프로그램 실행의 가장 기본적인 단위입니다. Opcode는 두 개의 매개변수(op1, op2), 반환 값 및 처리 기능으로 구성됩니다. PHP 프로그램은 궁극적으로 일련의 opcode 처리 기능의 순차적 실행으로 변환됩니다.

몇 가지 일반적인 처리 기능:

ZEND_ASSIGN_SPEC_CV_CV_HANDLER : 变量分配 ($a=$b)
ZEND_DO_FCALL_BY_NAME_SPEC_HANDLER:函数调用
ZEND_CONCAT_SPEC_CV_CV_HANDLER:字符串拼接 $a.$b
ZEND_ADD_SPEC_CV_CONST_HANDLER: 加法运算 $a+2
ZEND_IS_EQUAL_SPEC_CV_CONST:判断相等 $a==1
ZEND_IS_IDENTICAL_SPEC_CV_CONST:判断相等 $a===1

5. HashTable - 핵심 데이터 구조

HashTable은 zend의 핵심 데이터 구조이며 거의 항상 zend의 구현에 사용됩니다. PHP 모든 일반적인 함수에 대해 우리가 알고 있는 PHP 배열은 또한 zend 내에서 함수 기호 테이블, 전역 변수 등과 같은 것도 해시 테이블을 기반으로 구현됩니다.

PHP의 해시 테이블은 다음과 같은 특징을 가지고 있습니다.

일반적인 키->값 쿼리를 지원합니다.

배열로 사용할 수 있습니다.

노드 추가 및 삭제는 다음과 같습니다. O (1) 복잡도

키가 혼합형 지원: 연관숫자 조합 인덱스 배열이 동시에 존재

값이 혼합형 지원: 배열("문자열",2332)

는 선형 순회를 지원합니다. 예를 들어 foreach

Zend 해시 테이블은 일반적인 해시 테이블 해시 구조를 구현하는 동시에 이중 연결 목록을 첨부하여 배열의 정방향 및 역방향 순회 기능을 제공합니다. 구조는 아래와 같습니다.

PHP의 기본 운영 메커니즘 및 원리

보시다시피 키->값 형태의 해시 구조와 이중 연결 리스트가 모두 있습니다. 모드를 사용하여 빠른 검색과 선형 순회를 지원하는 것이 매우 편리합니다.

해시 구조: Zend의 해시 구조는 연결 목록을 사용하여 충돌을 해결하는 일반적인 해시 테이블 모델입니다. zend의 해시 테이블은 자체 성장하는 데이터 구조라는 점에 유의해야 합니다. 해시 테이블이 가득 차면 동적으로 2배로 확장되고 요소의 위치가 변경됩니다. 초기 크기는 8입니다. 또한, 키->값 빠른 검색을 수행할 때 zend 자체도 공간을 시간과 교환하여 프로세스 속도를 높이기 위해 일부 최적화를 수행했습니다. 예를 들어, 빠른 결정을 위해 키 길이를 식별하기 위해 각 요소에서 nKeyLength 변수가 사용됩니다.

이중 연결 목록: Zend 해시 테이블은 연결 목록 구조를 통해 요소의 선형 순회를 구현합니다. 이론적으로는 순회를 위해 단방향 연결 목록을 사용하는 것으로 충분합니다. 양방향 연결 목록을 사용하는 주요 목적은 순회를 빠르게 삭제하고 방지하는 것입니다. Zend 해시 테이블은 배열로 사용될 때 일반적인 연관 배열을 지원하고 순차 인덱스 번호로 사용될 수도 있으며 둘을 혼합하는 것도 허용합니다.

PHP 연관 배열: 연관 배열은 일반적인 hash_table 애플리케이션입니다. 쿼리 프로세스는 다음 단계를 거칩니다. (코드에서 알 수 있듯이 이는 일반적인 해시 쿼리 프로세스이며 검색 속도를 높이기 위해 몇 가지 빠른 판단이 추가됩니다.):

getKeyHashValue h;
index = n & nTableMask;
Bucket *p = arBucket[index];
while (p) {
if ((p->h == h) & (p->nKeyLength == nKeyLength)) {
RETURN p->data;
}
p=p->next;
}

PHP 인덱스 배열 : 인덱스 배열은 우리가 흔히 볼 수 있는 Array of 이며, 아래 첨자를 통해 액세스됩니다. 예를 들어 $arr[0]의 경우 Zend HashTable은 내부적으로 정규화되어 있으며 인덱스 유형 키에는 해시 값과 nKeyLength(0)도 할당됩니다. 내부 멤버 변수 nNextFreeElement는 현재 할당된 최대 ID이며, 푸시할 때마다 자동으로 1씩 증가합니다. PHP가 연관 데이터와 비연관 데이터의 혼합을 달성할 수 있게 하는 것은 바로 이 정규화 프로세스입니다. 푸시 작업의 특수성으로 인해 PHP 배열의 인덱스 키 순서는 아래 첨자의 크기가 아니라 푸시 순서에 따라 결정됩니다. 예를 들어, $arr[1] = 2; $arr[2] = 3; Zend HashTable은 이를 인덱스 키로 취급합니다

6. PHP는 약한 유형의 언어는 변수 유형을 엄격하게 구분하지 않습니다. PHP는 변수를 선언할 때 유형을 지정할 필요가 없습니다. PHP는 프로그램 실행 중에 변수 유형의 암시적 변환을 수행할 수 있습니다. 다른 강력한 형식의 언어와 마찬가지로 프로그램에서 명시적인 형식 변환도 수행할 수 있습니다. PHP 변수는 단순 유형(int, string, bool), 컬렉션 유형(배열 자원 객체) 및 상수(const)로 나눌 수 있습니다. 위의 모든 변수는 내부적으로 동일한 구조 zval을 갖습니다.

Zval은 PHP 변수를 식별하고 구현하는 데 사용되는 zend의 또 다른 매우 중요한 데이터 구조입니다. 해당 데이터 구조는 다음과 같습니다.

PHP의 기본 운영 메커니즘 및 원리

Zval은 주로 세 부분으로 구성됩니다.

type: 변수의 유형(정수, 문자열, 배열 등)을 지정합니다.

refcount&is_ref: 참조 카운팅을 구현하는 데 사용됩니다(자세한 소개 이후) )

value: 변수의 실제 데이터를 저장하는 핵심 부분

Zvalue는 변수의 실제 데이터를 저장하는 데 사용됩니다. 여러 유형을 저장해야 하기 때문에 zvalue는 공용체이므로 약한 유형 지정을 구현합니다.

PHP 변수 유형과 실제 저장 간의 대응 관계는 다음과 같습니다.

참조 카운팅은 메모리 재활용, 문자열 연산 등에 널리 사용됩니다. PHP의 변수는 참조 카운팅의 일반적인 응용 프로그램입니다. Zval의 참조 카운팅은 멤버 변수 is_ref 및 ref_count를 통해 구현됩니다. 참조 카운팅을 통해 여러 변수가 동일한 데이터를 공유할 수 있습니다. 잦은 복사로 인한 과도한 소비를 피하세요.
IS_LONG -> lvalue
IS_DOUBLE -> dvalue
IS_ARRAY -> ht
IS_STRING -> str
IS_RESOURCE -> lvalue

할당 작업을 수행할 때 zend는 변수를 동일한 zval 및 ref_count++로 가리키고, 설정 해제 작업 중에는 해당 ref_count-1을 가리킵니다. 소멸 작업은 ref_count가 0으로 감소된 경우에만 수행됩니다. 참조 할당인 경우 zend는 is_ref를 1로 수정합니다.

PHP变量通过引用计数实现变量共享数据,那如果改变其中一个变量值呢?当试图写入一个变量时,Zend若发现该变量指向的zval被多个变量共享,则为其复制一份ref_count为1的zval,并递减原zval的refcount,这个过程称为“zval分离”。可见,只有在有写操作发生时zend才进行拷贝操作,因此也叫copy-on-write(写时拷贝)

对于引用型变量,其要求和非引用型相反,引用赋值的变量间必须是捆绑的,修改一个变量就修改了所有捆绑变量。

整数、浮点数是PHP中的基础类型之一,也是一个简单型变量。对于整数和浮点数,在zvalue中直接存储对应的值。其类型分别是long和double。

从zvalue结构中可以看出,对于整数类型,和c等强类型语言不同,PHP是不区分int、unsigned int、long、long long等类型的,对它来说,整数只有一种类型也就是long。由此,可以看出,在PHP里面,整数的取值范围是由编译器位数来决定而不是固定不变的。

对于浮点数,类似整数,它也不区分float和double而是统一只有double一种类型。

在PHP中,如果整数范围越界了怎么办?这种情况下会自动转换为double类型,这个一定要小心,很多trick都是由此产生。

和整数一样,字符变量也是PHP中的基础类型和简单型变量。通过zvalue结构可以看出,在PHP中,字符串是由由指向实际数据的指针和长度结构体组成,这点和c++中的string比较类似。由于通过一个实际变量表示长度,和c不同,它的字符串可以是2进制数据(包含),同时在PHP中,求字符串长度strlen是O(1)操作。

在新增、修改、追加字符串操作时,PHP都会重新分配内存生成新的字符串。最后,出于安全考虑,PHP在生成一个字符串时末尾仍然会添加

常见的字符串拼接方式及速度比较:

假设有如下4个变量:$strA=‘123’; $strB = ‘456’; $intA=123; intB=456;

现在对如下的几种字符串拼接方式做一个比较和说明:

$res = $strA.$strB和$res = “$strA$strB”
这种情况下,zend会重新malloc一块内存并进行相应处理,其速度一般
$strA = $strA.$strB
这种是速度最快的,zend会在当前strA基础上直接relloc,避免重复拷贝
$res = $intA.$intB
这种速度较慢,因为需要做隐式的格式转换,实际编写程序中也应该注意尽量避免
$strA = sprintf (“%s%s”,$strA.$strB);

这会是最慢的一种方式,因为sprintf在PHP中并不是一个语言结构,本身对于格式识别和处理就需要耗费比较多时间,另外本身机制也是malloc。不过sprintf的方式最具可读性,实际中可以根据具体情况灵活选择。

PHP的数组通过Zend HashTable来天然实现。

foreach操作如何实现?对一个数组的foreach就是通过遍历hashtable中的双向链表完成。对于索引数组,通过foreach遍历效率比for高很多,省去了key->value的查找。count操作直接调用HashTable->NumOfElements,O(1)操作。对于’123’这样的字符串,zend会转换为其整数形式。$arr[‘123’]和$arr[123]是等价的

资源类型变量是PHP中最复杂的一种变量,也是一种复合型结构。

PHP的zval可以表示广泛的数据类型,但是对于自定义的数据类型却很难充分描述。由于没有有效的方式描绘这些复合结构,因此也没有办法对它们使用传统的操作符。要解决这个问题,只需要通过一个本质上任意的标识符(label)引用指针,这种方式被称为资源。

在zval中,对于resource,lval作为指针来使用,直接指向资源所在的地址。Resource可以是任意的复合结构,我们熟悉的mysqli、fsock、memcached等都是资源。

如何使用资源:

注册:对于一个自定义的数据类型,要想将它作为资源。首先需要进行注册,zend会为它分配全局唯一标示。

获取一个资源变量:对于资源,zend维护了一个id->实际数据的hash_tale。对于一个resource,在zval中只记录了它的id。fetch的时候通过id在hash_table中找到具体的值返回。

资源销毁:资源的数据类型是多种多样的。Zend本身没有办法销毁它。因此需要用户在注册资源的时候提供销毁函数。当unset资源时,zend调用相应的函数完成析构。同时从全局资源表中删除它。

资源可以长期驻留,不只是在所有引用它的变量超出作用域之后,甚至是在一个请求结束了并且新的请求产生之后。这些资源称为持久资源,因为它们贯通SAPI的整个生命周期持续存在,除非特意销毁。很多情况下,持久化资源可以在一定程度上提高性能。比如我们常见的mysql_pconnect ,持久化资源通过pemalloc分配内存,这样在请求结束的时候不会释放。

对zend来说,对两者本身并不区分。

PHP에서는 지역변수와 전역변수가 어떻게 구현되나요? 요청에 대해 PHP는 언제든지 두 개의 기호 테이블(symbol_table 및 active_symbol_table)을 볼 수 있으며 전자는 전역 변수를 유지하는 데 사용됩니다. 후자는 현재 활성화된 변수 기호 테이블을 가리키는 포인터입니다. 프로그램이 함수에 들어가면 zend는 기호 테이블 x를 여기에 할당하고 active_symbol_table을 a를 가리킵니다. 이러한 방식으로 전역 변수와 지역 변수의 구별이 이루어집니다.

변수 값 얻기: PHP의 기호 테이블은 hash_table을 통해 구현되며, 각 변수에는 고유 식별자가 할당됩니다. 변수 값을 얻으면 해당 식별자에 따라 테이블에서 해당 zval을 찾아 반환합니다.

함수에서 전역 변수 사용: 함수에서는 global을 명시적으로 선언하여 전역 변수를 사용할 수 있습니다. active_symbol_table에 같은 이름의 변수에 대한 참조를 생성합니다. Symbol_table에 같은 이름의 변수가 없으면 먼저 생성됩니다.


성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.