이 기사는 MySQL 잠금의 내부 구현 메커니즘에 대해 설명합니다. 모든 사람에게 도움이 되기를 바랍니다.
참고: 나열된 코드는 모두 Mysql-5.6
에서 가져온 것입니다. 관계형 데이터베이스가 점점 더 유사해지고 있지만 그 이면의 구현 메커니즘은 매우 다를 수 있습니다. 실제 사용 측면에서는 SQL 구문 사양이 존재하기 때문에 여러 관계형 데이터베이스에 익숙해지는 것이 어렵지 않지만 데이터베이스 수만큼 잠금 구현 방법이 있을 수 있습니다.
Microsoft SQL Server는 2005년 이전에만 페이지 잠금을 제공했습니다. 2005년 버전이 되어서야 낙관적 동시성 및 비관적 동시성을 지원하기 시작했습니다. SQL Server 설계에서는 행 수준 잠금이 허용됩니다. 잠금은 희소한 리소스입니다. 잠금 수가 클수록 오버헤드가 커집니다. 잠금 수의 급격한 증가로 인한 성능 저하를 방지하기 위해 잠금 업그레이드라는 메커니즘을 지원합니다. 행 잠금이 페이지 잠금으로 업그레이드되면 동시성 성능이 원본으로 돌아갑니다.
실제로 동일한 데이터베이스에서도 실행 엔진마다 잠금 기능에 대한 해석이 다릅니다. MyISAM의 경우 테이블 잠금만 지원하지만 동시 읽기는 허용되지 않습니다. Innodb는 비잠금 일관된 읽기 및 행 잠금을 지원한다는 점에서 Oracle과 매우 유사합니다. SQL Server와의 명백한 차이점은 총 잠금 수가 증가함에 따라 Innodb는 적은 비용만 지불하면 된다는 것입니다.
Innodb는 행 잠금을 지원하며 잠금 설명에 특별히 큰 오버헤드가 없습니다. 따라서 많은 수의 잠금으로 인해 성능 저하가 발생한 경우를 대비해 잠금 업그레이드 메커니즘이 필요하지 않습니다.
lock0priv.h 파일에서 발췌하면 Innodb의 행 잠금 정의는 다음과 같습니다.
/** Record lock for a page */ struct lock_rec_t { /* space id */ ulint space; /* page number */ ulint page_no; /** * number of bits in the lock bitmap; * NOTE: the lock bitmap is placed immediately after the lock struct */ ulint n_bits; };
동시성 제어는 행 수준으로 세분화할 수 있지만 잠금은 다음과 같이 구성 및 관리된다는 것을 어렵지 않게 볼 수 있습니다. 페이지 세분성. Innodb 설계에서는 공간 ID와 페이지 번호라는 두 가지 필수 조건을 통해 유일한 데이터 페이지를 결정할 수 있습니다. n_bits는 페이지의 행 잠금 정보를 설명하는 데 필요한 비트 수를 나타냅니다.
동일한 데이터 페이지의 각 레코드에는 고유한 연속 증가 시퀀스 번호인 heap_no가 할당됩니다. 특정 레코드 행이 잠겨 있는지 알고 싶다면 비트맵의 heap_no 위치에 있는 숫자가 잠겨 있는지 확인하기만 하면 됩니다. 하나. 잠금 비트맵은 데이터 페이지의 레코드 수를 기준으로 메모리 공간을 할당하므로 명시적으로 정의되지 않으며, 페이지 레코드가 계속 증가할 수 있으므로 LOCK_PAGE_BITMAP_MARGIN 크기의 공간을 예약해 둔다.
/** * Safety margin when creating a new record lock: this many extra records * can be inserted to the page without need to create a lock with * a bigger bitmap */ #define LOCK_PAGE_BITMAP_MARGIN 64
공간 ID = 20, 페이지 번호 = 100인 데이터 페이지에 현재 160개의 레코드가 있고, heap_no가 2, 3, 4인 레코드가 잠겨 있다고 가정하면 해당 lock_rec_t 구조와 데이터 페이지를 설명해야 합니다.
참고:
- 메모리의 잠금 비트맵은 선형적으로 분포되어야 합니다. 그림에 표시된 2차원 구조는 설명의 편의를 위한 것입니다.
- 비트맵과 lock_rec_t 구조는 연속 메모리입니다. . 그림 속 참조 관계는 그리기에도 필요합니다
이 페이지에 해당하는 비트맵의 두 번째, 세 번째, 네 번째 위치가 모두 1로 설정되어 있는 것을 볼 수 있습니다. 데이터 페이지는 인식 측면에서 상당히 제한적입니다. 구체적으로 얼마나 차지하는지요? 계산할 수 있습니다:
160 / 8 + 8 + 1 = 29바이트.
여기에 +1이 추가되어 있는데 아마도 정수 나누기를 피하기 위함일 것입니다. 결과 수치가 너무 작습니다. 161개의 레코드가 있는 경우 +1이 아닌 경우 계산된 20바이트로는 모든 레코드의 잠금 정보를 설명하기에는 부족합니다(예약된 비트를 사용하지 않음).
lock0priv.h 파일에서 발췌:
/* lock_rec_create函数代码片段 */ n_bits = page_dir_get_n_heap(page) + LOCK_PAGE_BITMAP_MARGIN; n_bytes = 1 + n_bits / 8; /* 注意这里是分配的连续内存 */ lock = static_cast<lock_t>( mem_heap_alloc(trx->lock.lock_heap, sizeof(lock_t) + n_bytes) ); /** * Gets the number of records in the heap. * @return number of user records */ UNIV_INLINE ulint page_dir_get_n_heap(const page_t* page) { return(page_header_get_field(page, PAGE_N_HEAP) & 0x7fff); }</lock_t>
Innodb는 테이블 잠금도 두 가지 범주로 나눌 수 있습니다. 자동 증가 잠금의 데이터 구조는 다음과 같습니다.
lock0priv .h 파일에서 발췌
struct lock_table_t { /* database table in dictionary cache */ dict_table_t* table; /* list of locks on the same table */ UT_LIST_NODE_T(lock_t) locks; };
ut0lst.h 파일에서 발췌
struct ut_list_node { /* pointer to the previous node, NULL if start of list */ TYPE* prev; /* pointer to next node, NULL if end of list */ TYPE* next; }; #define UT_LIST_NODE_T(TYPE) ut_list_node<type></type>
위의 lock_rec_t 및 lock_table_t 구조는 트랜잭션에서 잠금이 생성되는 별도의 정의일 뿐입니다. 트랜잭션은 행 잠금에 해당합니다. 테이블 잠금에는 다음과 같이 정의된 해당 잠금 구조가 있습니다.
/** Lock struct; protected by lock_sys->mutex */ struct lock_t { /* transaction owning the lock */ trx_t* trx; /* list of the locks of the transaction */ UT_LIST_NODE_T(lock_t) trx_locks; /** * lock type, mode, LOCK_GAP or LOCK_REC_NOT_GAP, * LOCK_INSERT_INTENTION, wait flag, ORed */ ulint type_mode; /* hash chain node for a record lock */ hash_node_t hash; /*!<p> lock_t是根据每个事务每个页(或表)来定义的,但是一个事务往往涉及到多个页,因此需要链表<strong>trx_locks</strong>串联起一个事务相关的所有锁信息。除了需要根据事务查询到所有锁信息,实际场景还要求系统必须能够快速高效的检测出某个行记录是否已经上锁。因此必须有一个全局变量支持对行记录进行锁信息的查询。Innodb选择了哈希表,其定义如下:</p><p> 摘自<strong>lock0lock.h</strong>文件</p><pre class="brush:php;toolbar:false">/** The lock system struct */ struct lock_sys_t { /* Mutex protecting the locks */ ib_mutex_t mutex; /* 就是这里: hash table of the record locks */ hash_table_t* rec_hash; /* Mutex protecting the next two fields */ ib_mutex_t wait_mutex; /** * Array of user threads suspended while waiting forlocks within InnoDB, * protected by the lock_sys->wait_mutex */ srv_slot_t* waiting_threads; /* * highest slot ever used in the waiting_threads array, * protected by lock_sys->wait_mutex */ srv_slot_t* last_slot; /** * TRUE if rollback of all recovered transactions is complete. * Protected by lock_sys->mutex */ ibool rollback_complete; /* Max wait time */ ulint n_lock_max_wait_time; /** * Set to the event that is created in the lock wait monitor thread. * A value of 0 means the thread is not active */ os_event_t timeout_event; /* True if the timeout thread is running */ bool timeout_thread_active; };
函数lock_sys_create在database start之际负责初始化lock_sys_t结构。rec_hash的hash slot数量由srv_lock_table_size变量决定。rec_hash哈希表的key值通过页的space id,page number计算得出。
摘自lock0lock.ic、ut0rnd.ic 文件
/** * Calculates the fold value of a page file address: used in inserting or * searching for a lock in the hash table. * * @return folded value */ UNIV_INLINE ulint lock_rec_fold(ulint space, ulint page_no) { return(ut_fold_ulint_pair(space, page_no)); } /** * Folds a pair of ulints. * * @return folded value */ UNIV_INLINE ulint ut_fold_ulint_pair(ulint n1, ulint n2) { return ( ( (((n1 ^ n2 ^ UT_HASH_RANDOM_MASK2) <p> 这将意味着无法提供一个手段使得我们可以直接得知某一行是否上锁。而是应该先通过其所在的页得到space id、page number通过<strong>lock_rec_fold</strong>函数得出key值而后经过hash查询得到lock_rec_t,而后根据heap_no扫描bit map,最终确定锁信息。<strong>lock_rec_get_first</strong>函数实现了上述逻辑:</p><p> 这里返回的其实是<strong>lock_t</strong>对象,摘自<strong>lock0lock.cc</strong>文件</p><pre class="brush:php;toolbar:false">/** * Gets the first explicit lock request on a record. * * @param block : block containing the record * @param heap_no : heap number of the record * * @return first lock, NULL if none exists */ UNIV_INLINE lock_t* lock_rec_get_first(const buf_block_t* block, ulint heap_no) { lock_t* lock; ut_ad(lock_mutex_own()); for (lock = lock_rec_get_first_on_page(block); lock; lock = lock_rec_get_next_on_page(lock) ) { if (lock_rec_get_nth_bit(lock, heap_no)) { break; } } return(lock); }
锁维护以页的粒度,不是一个最高效直接的方式,明显的时间换空间,这种设计使得锁的开销很小。某一事务对任一行上锁的开销都是一样的,锁数量的上升也不会带来额外的内存消耗。
每个事务都对应一个trx_t的内存对象,其中保存着该事务锁信息链表和正在等待的锁信息。因此存在如下两种途径对锁进行查询:
上述各种数据结构,对其整理关系如下图所示:
注:
- lock_sys_t中的slot颜色与lock_t颜色相同则表明lock_sys_t slot持有lock_t
指针信息,实在是没法连线,不然图很混乱
【相关推荐:mysql视频教程】
위 내용은 Mysql 잠금의 내부 구현 메커니즘에 대해 설명하는 기사의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!