>백엔드 개발 >PHP 튜토리얼 >PHP-TSRM 스레드 안전 관리자 - 소스 코드 분석

PHP-TSRM 스레드 안전 관리자 - 소스 코드 분석

*文
*文원래의
2017-12-21 17:08:531583검색

PHP 소스 코드를 보거나 PHP 확장을 개발할 때 함수 매개변수 위치에 다수의 TSRMLS_ 매크로가 나타납니다. 이러한 매크로는 스레드 안전 메커니즘(Zend Thread `Safety, 줄여서 ZTS)을 위해 Zend에서 제공하는 것입니다. 보안은 멀티 스레드 환경에서 PHP 인터프리터가 모듈 형태로 로드 및 실행되어 일부 내부 공용 리소스에서 읽기 오류가 발생하는 것을 방지하기 위해 제공되는 솔루션입니다.

TSRM을 사용해야 하는 경우

서버가 멀티 스레드 환경이고 PHP가 모듈 형식으로 제공되는 한 작업자 모드(멀티 프로세스)와 같은 TSRM을 활성화해야 합니다. 멀티 스레드) 아파치 환경에서는 이런 상황이 필요합니다. 스레드 안전 버전의 PHP를 사용하려면 TSRM을 활성화해야 합니다. Linux에서는 PHP를 컴파일할 때 TSRM을 활성화할지 여부를 지정합니다. Windows에서는 스레드 안전 버전과 스레드로부터 안전하지 않은 PHP 버전이 제공됩니다.

PHP에서 TSRM을 구현하는 방법

일반적인 다중 스레드 환경에서는 공용 리소스를 작동하기 위해 뮤텍스 잠금이 추가되지만, 잠금으로 인해 성능이 저하될 수 있으므로 PHP는 잠금을 선택하지 않습니다. PHP의 솔루션은 각 스레드를 제공하는 것입니다. 현재 PHP 커널의 모든 공개 리소스의 복사본을 복사합니다. 각 스레드는 자체 공개 리소스 영역을 가리키며 서로 영향을 주지 않습니다.

공용 리소스란

다양한 구조체 구조 정의입니다

TSRM 데이터 구조

tsrm_tls_entry 스레드 구조, 각 스레드에는 이 구조의 복사본이 있습니다

typedef struct _tsrm_tls_entry tsrm_tls_entry;
struct _tsrm_tls_entry {
    void **storage;   
    int count;
    THREAD_T thread_id;
    tsrm_tls_entry *next;
}
static tsrm_tls_entry   **tsrm_tls_table = NULL //线程指针表头指针
static int  tsrm_tls_table_size;  //当前线程结构体数量

필드 설명

void **storage :资源指针、就是指向自己的公共资源内存区
int count : 资源数、就是 PHP内核 + 扩展模块 共注册了多少公共资源
THREAD_T thread_id : 线程id
tsrm_tls_entry *next:指向下一个线程指针,因为当前每一个线程指针都存在一个线程指针表里(类似于hash表),这个next可以理解成是hash冲突链式解决法.
tsrm_resource_type 公共资源类型结构体、注册了多少公共资源就有多少个该结构体
typedef struct {
    size_t size;
    ts_allocate_ctor ctor;
    ts_allocate_dtor dtor;
    int done; 
} tsrm_resource_type;
static tsrm_resource_type   *resource_types_table=NULL;  //公共资源类型表头指针
static int  resource_types_table_size; //当前公共资源类型数量

필드 설명

size_t size : 资源大小
ts_allocate_ctor ctor: 构造函数指针、在给每一个线程创建该资源的时候会调用一下当前ctor指针
ts_allocate_dtor dtor : 析构函数指针、释放该资源的时候会调用一下当前dtor指针
int done : 资源是否已经销毁 0:正常 1:已销毁

글로벌 리소스 ID

으아아아

글로벌 리소스 ID란 무엇입니까

TSRM은 공용 리소스를 등록할 때 각 리소스에 대해 고유한 ID를 생성합니다. 나중에 리소스를 얻을 때 해당 리소스 ID를 지정해야 합니다.

전역 리소스 ID가 필요한 이유

각 스레드는 현재 등록된 모든 공용 리소스, 즉 malloc() 대규모 배열을 복사하고 이 리소스 ID는 배열의 인덱스입니다. 해당 리소스를 얻으려면 해당 리소스의 ID를 지정해야 합니다.

이해하기 쉽습니다:
TSRM은 각 스레드가 자신의 공용 리소스 더미(배열)를 가리킬 수 있도록 허용하고, 이 공용 리소스 더미에서 원하는 리소스를 찾으려면 해당하는 리소스만 사용해야 합니다. 리소스 ID가 필요합니다. 이 스레드 안전 버전이 아닌 경우 이러한 공용 리소스는 더미로 집계되지 않으며 해당 이름을 통해 직접 얻을 수 있습니다.

실행 프로세스에 대하여

커널 초기화 중에 TSRM 초기화, 커널에 관련된 공용 리소스 등록, 외부 확장에 관련된 공용 리소스 등록 등을 수행합니다.

해당 스레드는 PHP 인터프리터 함수 입력 위치를 호출하여 현재 스레드의 공개 리소스 데이터를 초기화합니다.

공용 리소스가 필요하신 경우 해당 리소스 ID를 통해 얻으시면 됩니다.

TSRM 초기화 구조 다이어그램


PHP-TSRM 스레드 안전 관리자 - 소스 코드 분석

TSRM 소스 파일 경로

typedef int ts_rsrc_id;
static ts_rsrc_id   id_count;

TSRM에는 주요 기능이 포함됩니다.

tsrm 초기화

/php-5.3.27/TSRM/TSRM.c
/php-5.3.27/TSRM/TSRM.h

공용 리소스 등록

tsrm_startup()

모두 가져오기 및 등록 공공 자원, 아니오 존재한다면 초기화하고 스토리지 포인터를 반환합니다

ts_allocate_id()

리소스 ID를 지정하여 해당 리소스를 가져옵니다

#define TSRMLS_FETCH() void ***tsrm_ls = (void ***) ts_resource_ex(0, NULL)

현재 스레드를 초기화하고 기존 공용 리소스 데이터를 스토리지 포인터에 복사합니다

#define ts_resource(id)    ts_resource_ex(id, NULL)

TSRM 몇 가지 일반적인 매크로 정의

allocate_new_resource()

TSRM이 켜져 있고 ZTS가 true인 경우 이 TSRM 매크로 세트가 확장에서 자주 볼 수 있는 함수 매개변수 목록의 이러한 매크로가 void ***tsrm_ls로 대체되는 것을 볼 수 있습니다. 실제로 위의 내용은 현재 스레드가 이 함수를 호출하고 스레드의 공용 리소스 영역 주소 &storage**를 전달하여 함수의 내부 실행 프로세스가 해당 스레드의 공용 리소스를 정확하게 획득하는지 확인한다는 것입니다

TSRM 대략적인 내용입니다. 함수 호출 방법

calls
TSRMLS_FETCH( ) 바꾸기 void ***tsrm_ls

Execute

#ifdef ZTS
#define TSRMLS_D   void ***tsrm_ls
#define TSRMLS_DC  , TSRMLS_D
#define TSRMLS_C   tsrm_ls
#define TSRMLS_CC  , TSRMLS_C
#else
#define TSRMLS_D   void
#define TSRMLS_DC
#define TSRMLS_C
#define TSRMLS_CC
#endif

Replace

->  test(int a  TSRMLS_CC) -> test_1(int b TSRMLS_CC)

TSRM 해제 방법

위에 언급된 아파치의 작업자 모드 다중 프로세스 다중 스레딩을 한 프로세스가 여러 스레드를 열어 PHP 인터프리터를 호출한다는 의미입니다. 각 스레드가 종료되면 현재 스레드에서 생성된 리소스 데이터가 즉시 삭제되지 않습니다(스레드가 즉시 다시 사용될 수 있으므로 다시 작업할 필요가 없습니다). - 스레드에 해당하는 모든 공용 리소스 데이터를 초기화하고 직접 사용할 수 있습니다. 그러나 프로세스가 종료되려고 하면 모든 스레드를 순회하여 모든 스레드와 해당 리소스 데이터를 해제합니다.

소스 코드 설명

tsrm_startup 함수 설명

->  test(int a  ,tsrm_ls) -> test_1(int b ,tsrm_ls)

일반적으로 이 함수는 PHP 커널이 초기화될 때 호출됩니다. 메모리를 절약하기 위해 기본값은 스레드 개수이고 그렇지 않은 경우에는 리소스 유형 개수입니다. ㅋㅋㅋ 나중에 확장될 예정입니다

ts_allocate_id 함수 설명

TSRM_API int tsrm_startup(int expected_threads, int expected_resources, int debug_level, char *debug_filename)
{
    //省略...
    
    //默认线程数
    tsrm_tls_table_size = expected_threads;
    //创建tsrm_tls_entry指针数组
    tsrm_tls_table = (tsrm_tls_entry **) calloc(tsrm_tls_table_size, sizeof(tsrm_tls_entry *));
    //省略...
    
    //全局资源唯一ID初始化
    id_count=0;
    //默认资源类型数
    resource_types_table_size = expected_resources;
    //省略...
    
    //创建tsrm_resource_type结构体数组
    resource_types_table = (tsrm_resource_type *) calloc(resource_types_table_size, sizeof(tsrm_resource_type));
    //省略...
    
    return 1;
}

이 함수는 공용 리소스 데이터를 등록하고 생성할 때 호출되어야 하며 일반적으로 멀티스레드 환경에서 호출되는 것으로 볼 수 있습니다. 모든 스레드 구조 포인터와 연속적인 ralloc 및 malloc이므로 이 함수를 반복적으로 호출하면 성능 저하가 발생합니다.

TSRMLS_FETCH() ->

我们在开发扩展的时候也要按照线程安全版本去开发,通过 ZTS 宏判断当前 PHP 是否线程安全版本.

扩展里公共资源定义:

//定义公共资源数据,替换之后就是一个zend_模块名字的结构体
ZEND_BEGIN_MODULE_GLOBALS(module_name)
int id;
char name;
ZEND_END_MODULE_GLOBALS(module_name)
//对应的宏定义
#define ZEND_BEGIN_MODULE_GLOBALS(module_name)
    typedef struct _zend_##module_name##_globals {
#define ZEND_END_MODULE_GLOBALS(module_name)
} zend_##module_name##_globals;
//替换后
typedef struct _zend_module_name_globals {
   int id;
   char name;
} zend_module_name_globals;

扩展里的资源id定义

#ifdef ZTS
  #define ZEND_DECLARE_MODULE_GLOBALS(module_name)              
          ts_rsrc_id module_name##_globals_id;
#else
#define ZEND_DECLARE_MODULE_GLOBALS(module_name)                               
          zend_##module_name##_globals module_name##_globals;
#endif

(1) 线程安全版本:则自动声明全局资源唯一id,因为每个线程都会通过当前的id去storage指向内存区获取资源数据
(2)非线程安全版本:则自动声明当前结构体变量,每次通过变量名获取资源就好了,因为不存在其他线程争抢的情况

扩展里获取公共资源数据

#ifdef ZTS
    #define MODULE_G(v) TSRMG(xx_globals_id, zend_xx_globals *, v)
#else
    #define MODULE_G(v) (xx_globals.v)
#endif

如上每次获取资源全部通过自己定义的MODULE_G()宏获取,如果是线程安全则通过对应的TSRM管理器获取当前线程指定的资源id数据,如果不是则直接通过资源变量名字获取即可

扩展里初始化公共资源

//一般初始化公共资源数据,都会在扩展的MINIT函数执行
//如果是ZTS则ts_allocate_id调用之.
PHP_MINIT_FUNCTION(myextension){
    #ifdef ZTS
       ts_allocate_id(&xx_globals_id,sizeof(zend_module_name_globals),ctor,dtor)
    #endif
}

结束

上面介绍的就是PHP-TSRM线程安全管理器的实现,了解TSRM之后,无论是看内核源码还是开发PHP扩展都有很大的好处,因为内核和扩展里面充斥着大量的TSRM_宏定义.


相关阅读:

PHP中的TSRM及其宏的使用(线程安全管理)

php cgi与fpm关系

PHP CGI FastCGI php-fpm 解惑

위 내용은 PHP-TSRM 스레드 안전 관리자 - 소스 코드 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.