집 >데이터 베이스 >MySQL 튜토리얼 >MySQL 트랜잭션의 ACID 특성 구현 원리에 대한 자세한 소개(그림 및 텍스트)
이 기사의 내용은 MySQL 트랜잭션의 ACID 기능 구현 원리에 대한 자세한 소개(그림 및 텍스트)입니다. 필요한 친구가 참고할 수 있기를 바랍니다. 너. .
트랜잭션은 MySQL과 같은 관계형 데이터베이스를 NoSQL과 구별하는 중요한 측면이며, 데이터 일관성을 보장하는 중요한 수단입니다. 이 글에서는 먼저 트랜잭션과 관련된 MySQL 기본 개념을 소개한 다음 트랜잭션의 ACID 특징을 소개하고 구현 원리를 분석합니다.
MySQL은 광범위하고 심오하므로 기사의 누락은 불가피합니다.
1. 기본 개념
트랜잭션은 데이터베이스에 액세스하고 업데이트하기 위한 프로그램 실행 단위입니다. 트랜잭션에는 모두 실행되거나 전혀 실행되지 않는 하나 이상의 SQL 문이 포함될 수 있습니다. 관계형 데이터베이스로서 MySQL은 트랜잭션을 지원합니다. 이 기사는 MySQL5.6을 기반으로 합니다.
먼저 MySQL 트랜잭션의 기본 사항을 검토하세요. (추천 과정: MySQL 동영상 튜토리얼)
1. 논리적 아키텍처 및 스토리지 엔진
위 그림에 표시된 것처럼 MySQL 서버 논리적 아키텍처는 위에서 아래로 세 가지 계층으로 나눌 수 있습니다.
(1) 첫 번째 레이어: 클라이언트 연결, 인증 인증 등을 처리합니다.
(2) 두 번째 계층: 쿼리 문의 구문 분석, 최적화, 캐싱, 내장 함수 구현, 저장 프로시저 등을 담당하는 서버 계층입니다.
(3) 세 번째 계층: MySQL에서 데이터 저장 및 검색을 담당하는 스토리지 엔진. MySQL의 서버 계층은 트랜잭션을 관리하지 않으며 트랜잭션은 스토리지 엔진에 의해 구현됩니다. MySQL의 트랜잭션을 지원하는 스토리지 엔진에는 InnoDB, NDB Cluster 등이 있으며 그중 InnoDB가 가장 널리 사용됩니다. MyIsam, Memory 등과 같은 다른 스토리지 엔진은 트랜잭션을 지원하지 않습니다.
별도의 언급이 없는 한, 다음 글에 설명된 내용은 InnoDB를 기준으로 작성되었습니다.
일반적인 MySQL 트랜잭션은 다음과 같이 작동합니다.
start transaction; …… #一条或多条sql语句 commit;
여기서 start transaction은 트랜잭션의 시작을 식별하고, commit은 트랜잭션을 커밋하고, 실행 결과를 데이터베이스에 기록합니다. SQL 문 실행에 문제가 있는 경우 성공적으로 실행된 모든 SQL 문을 롤백하기 위해 롤백(rollback)이 호출됩니다. 물론 트랜잭션에서 직접 롤백 문을 사용하여 롤백할 수도 있습니다.
Autocommit
MySQL은 아래와 같이 기본적으로 자동 커밋 모드를 사용합니다.
자동 커밋 모드에서 트랜잭션을 명시적으로 시작하는 시작 트랜잭션이 없으면 각 SQL 문은 트랜잭션으로 처리됩니다. 커밋 작업을 수행합니다.
다음과 같은 방법으로 자동 커밋을 끌 수 있습니다. 자동 커밋 매개변수는 연결에 따라 다르므로 한 연결에서 매개변수를 수정해도 다른 연결에는 영향을 미치지 않습니다.
자동 커밋이 꺼진 경우 커밋이나 롤백이 실행되고 트랜잭션이 종료되고 다른 트랜잭션이 시작될 때까지 모든 SQL 문은 하나의 트랜잭션에 있습니다.
특수 작업
MySQL에는 몇 가지 특수 명령이 있습니다. 트랜잭션에서 이러한 명령을 실행하면 DDL 문(테이블 생성/테이블 삭제/변경/테이블 생성)과 같이 커밋이 즉시 트랜잭션을 실행하게 됩니다. ), 잠금 테이블 문 등.
그러나 일반적으로 사용되는 선택, 삽입, 업데이트 및 삭제 명령은 트랜잭션을 강제로 제출하지 않습니다.
ACID는 트랜잭션의 네 가지 특성을 측정한 것입니다.
원자성(또는 불가분성)
Consistency(일관성)
Isolation(격리)
Durability (내구성 )
엄격한 기준에 따르면 ACID 특성을 동시에 충족하는 트랜잭션만 트랜잭션으로 간주되지만, 주요 데이터베이스 공급업체의 구현에서는 실제로 ACID를 충족하는 트랜잭션이 거의 없습니다. 예를 들어 MySQL의 NDB 클러스터 트랜잭션은 내구성과 격리를 충족하지 않습니다. InnoDB의 기본 트랜잭션 격리 수준은 격리를 충족하지 않는 반복 가능한 읽기입니다. Oracle의 기본 트랜잭션 격리 수준은 격리를 충족하지 않는 READ COMMITTED입니다. ACID는 거래가 충족해야 하는 조건이라기보다는 거래를 측정하는 4가지 차원입니다.
ACID의 특징과 그 구현 원리는 이해의 편의를 위해 아래에 자세히 소개되며, 소개 순서는 엄격하게 A-C-I-D가 아닙니다. 2. 원자성1. 정의 원자는 트랜잭션의 SQL 문이 실행되지 않으면 작업이 수행되거나 수행되지 않는 분할할 수 없는 작업 단위임을 의미합니다. 문도 롤백되어야 하며 데이터베이스는 트랜잭션 이전 상태로 반환되어야 합니다.원자성 원리를 설명하기 전에 먼저 MySQL 트랜잭션 로그를 소개합니다. MySQL 로그에는 바이너리 로그, 오류 로그, 쿼리 로그, 느린 쿼리 로그 등 다양한 유형이 있습니다. 또한 InnoDB 스토리지 엔진은 두 가지 유형의 트랜잭션 로그인 리두 로그(redo log)와 실행 취소 로그( 롤백 로그). 재실행 로그는 트랜잭션 내구성을 보장하는 데 사용됩니다. 실행 취소 로그는 트랜잭션 원자성과 격리의 기초입니다.
실행 취소 로그에 대해 이야기해 보겠습니다. 원자성을 달성하는 핵심은 트랜잭션이 롤백될 때 성공적으로 실행된 모든 SQL 문을 실행 취소할 수 있는 것입니다. InnoDB는 실행 취소 로그에 의존하여 롤백을 실현합니다: 트랜잭션이 데이터베이스를 수정하면 InnoDB는 해당 실행 취소 로그를 생성합니다. 트랜잭션 실행이 실패하거나 롤백이 호출되면 트랜잭션은 다음을 수행해야 합니다. 롤백하려면 실행 취소 로그의 정보를 사용하여 데이터를 수정 전의 상태로 롤백할 수 있습니다.
undo 로그는 SQL 실행과 관련된 정보를 기록하는 논리적 로그입니다. 롤백이 발생하면 InnoDB는 실행 취소 로그의 내용을 기반으로 이전 작업과 반대되는 작업을 수행합니다. 각 삽입에 대해 각 삭제에 대해 삭제가 실행되고 각 업데이트에 대해 삽입이 실행됩니다. , 롤백 중에 삭제가 실행됩니다. 롤링 시 데이터를 다시 변경하기 위해 역방향 업데이트가 수행됩니다.
업데이트 작업을 예로 들어 보겠습니다. 트랜잭션이 업데이트를 실행할 때 생성된 실행 취소 로그에는 수정된 행의 기본 키(수정된 행을 알기 위해), 수정된 열과 같은 정보가 포함됩니다. , 그리고 수정 전과 수정 후의 이러한 열의 값을 사용하면 롤백 시 이 정보를 사용하여 업데이트 전 상태로 데이터를 복원할 수 있습니다.
지속성은 트랜잭션이 제출되면 데이터베이스에 대한 변경 사항이 영구적이어야 함을 의미합니다. 후속 작업이나 실패는 이에 영향을 미치지 않습니다.
redo 로그와 undo 로그는 모두 InnoDB 트랜잭션 로그에 속합니다. 먼저 리두로그가 존재하게 된 배경에 대해 이야기해보자.
InnoDB는 MySQL의 스토리지 엔진으로 데이터가 디스크에 저장됩니다. 그러나 데이터를 읽고 쓸 때마다 디스크 IO가 필요하면 효율성이 매우 낮습니다. 이를 위해 InnoDB는 캐시(버퍼 풀)를 제공합니다. 버퍼 풀은 디스크의 일부 데이터 페이지 매핑을 포함하고 데이터베이스에 액세스하기 위한 버퍼 역할을 합니다. 데이터베이스에서 데이터를 읽을 때 먼저 읽습니다. Buffer Pool. Buffer Pool이 Pool에 없으면 데이터베이스에 데이터를 쓸 때 디스크에서 읽어서 Buffer Pool에 넣고, Buffer Pool에 먼저 쓰고 수정한다. 버퍼 풀의 데이터는 정기적으로 디스크에 새로 고쳐집니다(이 프로세스를 더티 플러싱이라고 함).
버퍼 풀을 사용하면 데이터 읽기 및 쓰기 효율성이 크게 향상되지만 새로운 문제도 발생합니다. MySQL이 다운되고 버퍼 풀의 수정된 데이터가 디스크에 플러시되지 않으면 데이터 손실이 발생합니다. 거래 내구성은 보장되지 않습니다.
그래서 이 문제를 해결하기 위해 리두 로그가 도입되었습니다. 데이터가 수정되면 버퍼 풀의 데이터를 수정하는 것 외에도 트랜잭션이 제출될 때 작업이 리두 로그인 fsync 인터페이스에 기록됩니다. 리두 로그 플레이트를 플러시하기 위해 호출됩니다. MySQL이 다운되면 redo 로그의 데이터를 읽고 다시 시작할 때 데이터베이스를 복원할 수 있습니다. Redo 로그는 WAL(Write-ahead Logging, Write-ahead Log)을 사용하여 모든 수정사항을 먼저 로그에 기록한 후 버퍼 풀에 업데이트하므로 MySQL 다운타임으로 인해 데이터가 손실되지 않도록 하여 내구성을 충족합니다. 요구 사항.
리두 로그도 트랜잭션이 커밋될 때 디스크에 로그를 써야 하는데 왜 버퍼 풀의 수정된 데이터를 디스크에 직접 쓰는 것(즉, 더러워지는 것)보다 빠른가요? 그 이유는 크게 두 가지입니다.
(1) Dirty cleaning은 매번 수정되는 데이터 위치가 무작위이기 때문에 무작위 IO이지만, redo 로그를 작성하는 것은 추가 작업이며 순차 IO에 속합니다.
(2) 더티화 단위는 데이터 페이지(페이지)입니다. MySQL의 기본 페이지 크기는 16KB입니다. 페이지를 조금만 수정하면 전체 페이지를 작성해야 하지만 리두 로그에는 실제로 필요한 부분만 포함됩니다. , 유효하지 않은 IO가 크게 줄어듭니다.
MySQL에는 쓰기 작업을 기록하고 데이터 복구에도 사용할 수 있는 binlog(바이너리 로그)가 있다는 것을 알고 있지만 두 로그는 근본적으로 다릅니다.
(1) 기능 차이점: Redo 로그는 MySQL 다운타임이 내구성에 영향을 주지 않도록 하기 위해 충돌 복구에 사용됩니다. binlog는 서버가 시점을 기반으로 데이터를 복구할 수 있도록 보장하기 위해 특정 시점 복구에 사용됩니다. 마스터-슬레이브 복사본.
(2) 다양한 수준: redo 로그는 InnoDB 스토리지 엔진에 의해 구현되고, binlog는 MySQL 서버 계층에 의해 구현되며(문서 앞부분의 MySQL 논리 아키텍처 소개 참조) InnoDB와 기타를 모두 지원합니다. 스토리지 엔진.
(3) 내용이 다릅니다. redo 로그는 물리적 로그이고 내용은 디스크의 페이지를 기반으로 하며 binlog는 논리적 로그이고 내용은 SQL의 일부입니다.
(4) 쓰기 타이밍이 다릅니다. binlog는 트랜잭션이 커밋될 때 작성됩니다. 리두 로그의 쓰기 타이밍은 상대적으로 다양합니다.
앞서 언급한 대로: 트랜잭션이 커밋되면 fsync가 호출됩니다. 재실행 로그를 플러시합니다. 이는 기본 전략입니다. innodb_flush_log_at_trx_commit 매개변수를 수정하면 전략이 변경될 수 있지만 트랜잭션의 내구성은 보장되지 않습니다.
除了事务提交时,还有其他刷盘时机:如master thread每秒刷盘一次redo log等,这样的好处是不一定要等到commit时刷盘,commit速度大大加快。
与原子性、持久性侧重于研究事务本身不同,隔离性研究的是不同事务之间的相互影响。隔离性是指,事务内部的操作与其他事务是隔离的,并发执行的各个事务之间不能互相干扰。严格的隔离性,对应了事务隔离级别中的Serializable (可串行化),但实际应用中出于性能方面的考虑很少会使用可串行化。
隔离性追求的是并发情形下事务之间互不干扰。简单起见,我们仅考虑最简单的读操作和写操作(暂时不考虑带锁读等特殊操作),那么隔离性的探讨,主要可以分为两个方面:
(一个事务)写操作对(另一个事务)写操作的影响:锁机制保证隔离性
(一个事务)写操作对(另一个事务)读操作的影响:MVCC保证隔离性
首先来看两个事务的写操作之间的相互影响。隔离性要求同一时刻只能有一个事务对数据进行写操作,InnoDB通过锁机制来保证这一点。
锁机制的基本原理可以概括为:事务在修改数据之前,需要先获得相应的锁;获得锁之后,事务便可以修改数据;该事务操作期间,这部分数据是锁定的,其他事务如果需要修改数据,需要等待当前事务提交或回滚后释放锁。
行锁与表锁
按照粒度,锁可以分为表锁、行锁以及其他位于二者之间的锁。表锁在操作数据时会锁定整张表,并发性能较差;行锁则只锁定需要操作的数据,并发性能好。但是由于加锁本身需要消耗资源(获得锁、检查锁、释放锁等都需要消耗资源),因此在锁定数据较多情况下使用表锁可以节省大量资源。MySQL中不同的存储引擎支持的锁是不一样的,例如MyIsam只支持表锁,而InnoDB同时支持表锁和行锁,且出于性能考虑,绝大多数情况下使用的都是行锁。
如何查看锁信息
有多种方法可以查看InnoDB中锁的情况,例如:
select * from information_schema.innodb_locks; #锁的概况 show engine innodb status; #InnoDB整体状态,其中包括锁的情况
下面来看一个例子:
#在事务A中执行: start transaction; update account SET balance = 1000 where id = 1; #在事务B中执行: start transaction; update account SET balance = 2000 where id = 1;
此时查看锁的情况:
show engine innodb status查看锁相关的部分:
通过上述命令可以查看事务24052和24053占用锁的情况;其中lock_type为RECORD,代表锁为行锁(记录锁);lock_mode为X,代表排它锁(写锁)。
除了排它锁(写锁)之外,MySQL中还有共享锁(读锁)的概念。由于本文重点是MySQL事务的实现原理,因此对锁的介绍到此为止,后续会专门写文章分析MySQL中不同锁的区别、使用场景等,欢迎关注。
介绍完写操作之间的相互影响,下面讨论写操作对读操作的影响。
首先来看并发情况下,读操作可能存在的三类问题:
(1)脏读:当前事务(A)中可以读到其他事务(B)未提交的数据(脏数据),这种现象是脏读。举例如下(以账户余额表为例):
(2)不可重复读:在事务A中先后两次读取同一个数据,两次读取的结果不一样,这种现象称为不可重复读。脏读与不可重复读的区别在于:前者读到的是其他事务未提交的数据,后者读到的是其他事务已提交的数据。举例如下:
(3)幻读:在事务A中按照某个条件先后两次查询数据库,两次查询结果的条数不同,这种现象称为幻读。不可重复读与幻读的区别可以通俗的理解为:前者是数据变了,后者是数据的行数变了。举例如下:
SQL标准中定义了四种隔离级别,并规定了每种隔离级别下上述几个问题是否存在。一般来说,隔离级别越低,系统开销越低,可支持的并发越高,但隔离性也越差。隔离级别与读问题的关系如下:
실제 애플리케이션에서 Read uncommitted는 동시성 수행 시 많은 문제를 일으킬 수 있지만, 다른 격리 수준에 비해 성능 향상이 매우 제한적이므로 덜 사용됩니다. 직렬화 가능트랜잭션을 직렬화하도록 하면 동시성 효율성이 매우 낮고 데이터 일관성 요구 사항이 매우 높고 동시성이 허용되지 않는 경우에만 사용할 수 있으므로 거의 사용되지 않습니다. 따라서 대부분의 데이터베이스 시스템에서 기본 격리 수준은 Read Committed(Oracle 등) 또는 Repeatable Read(이하 RR)입니다.
다음 두 명령을 통해 이 세션의 전역 격리 수준과 격리 수준을 볼 수 있습니다.
InnoDB의 기본 격리 수준은 RR이며, 나중에 RR에 대해 집중적으로 살펴보겠습니다. SQL 표준에서 RR은 팬텀 읽기 문제를 피할 수 없지만 InnoDB에서 구현한 RR은 팬텀 읽기 문제를 방지한다는 점에 유의해야 합니다.
RR은 더티 읽기, 반복 불가능 읽기, 팬텀 읽기 등의 문제를 해결합니다. MVCC를 사용합니다. MVCC의 전체 이름은 다중 버전 동시성 제어 프로토콜입니다. 다음 예는 MVCC의 특성을 잘 반영합니다. 동시에 서로 다른 트랜잭션에서 읽는 데이터는 다를 수 있습니다(즉, 여러 버전). T5 시점에 트랜잭션 A와 트랜잭션 C는 서로 다른 버전의 데이터를 읽을 수 있습니다.
MVCC의 가장 큰 장점은 읽기가 잠기지 않아 읽기와 쓰기에 충돌이 없고 동시성 성능이 좋다는 점입니다. InnoDB는 MVCC를 구현하며 주로 숨겨진 데이터 열(마크 비트라고도 함)과 실행 취소 로그에 의존하여 여러 버전의 데이터가 공존할 수 있습니다. 데이터의 숨겨진 열에는 데이터 행의 버전 번호, 삭제 시간, 실행 취소 로그에 대한 포인터 등이 포함됩니다. MySQL은 데이터를 읽을 때 숨겨진 열을 사용하여 롤백이 필요한지 여부를 찾을 수 있습니다. 롤백에 필요한 실행 취소 로그. 따라서 MVCC는 숨겨진 열의 세부 형식이 더 이상 구현되지 않습니다.
다음 내용은 위에 언급된 여러 문제를 바탕으로 별도로 설명하겠습니다.
(1) Dirty read
트랜잭션 A가 T3 시간 노드에서 zhangsan의 잔액을 읽으면 해당 데이터가 다른 트랜잭션에 의해 수정되었으며 상태가 커밋되지 않은 것으로 확인됩니다. 이때 트랜잭션 A는 최신 데이터를 읽은 후 해당 데이터의 Undo 로그를 기반으로 롤백 작업을 수행하고 트랜잭션 B가 수정되기 전의 데이터를 가져오므로 더티 읽기를 방지합니다.
(2) Non-repeatable read
트랜잭션 A가 T2 노드에서 처음으로 데이터를 읽을 때 데이터의 버전 번호가 기록됩니다. (데이터의 버전 번호는 행 단위로 기록됩니다.) 버전 번호가 1이라고 가정합니다. 트랜잭션 B가 커밋되면 이 행에 기록된 버전 번호가 증가합니다. 버전 번호가 2라고 가정하면 트랜잭션 A가 T5에서 데이터를 다시 읽을 때 데이터의 버전 번호가 발견됩니다. (2)는 첫 번째 읽기보다 그 당시 기록된 버전 번호(1)보다 크므로 Undo 로그에 따라 롤백 작업을 수행하여 버전 번호가 1일 때의 데이터를 가져오므로 반복 읽기가 가능합니다.
(3) 환상 읽기
InnoDB에서 구현한 RR은 다음 키 잠금 메커니즘을 통해 환상 읽기 현상을 방지합니다.
next-key lock은 행 잠금의 한 유형입니다. 그 구현은 레코드 잠금(record 잠금) + gap 잠금(gap lock)과 동일합니다. 스스로 기록합니다(기록 잠금 기능) 범위도 잠깁니다(갭 잠금 기능 기능). 물론, 여기서 말하는 것은 읽기 잠금 해제입니다. 이때 다음 키 잠금은 실제로 잠긴 것이 아니라 읽은 데이터에 표시를 추가할 뿐입니다(표시 내용에는 데이터의 버전 번호 등이 포함됩니다. ); 정확성을 위해 이를 다음 키 잠금 메커니즘이라고 합니다. 이전 예를 사용하여 설명하겠습니다.
트랜잭션 A가 T2 노드에서 처음으로 0 요약하면 InnoDB에서 구현한 RR은 잠금 메커니즘, 숨겨진 데이터 열, 실행 취소 로그 및 다음 키 잠금을 통해 특정 수준의 격리를 달성하며 이는 대부분의 시나리오의 요구 사항을 충족할 수 있습니다. 그러나 RR은 가상 읽기 문제를 방지하지만 결국 직렬화 가능하지 않으며 완전한 격리를 보장할 수 없다는 점에 유의해야 합니다. 다음은 직접 확인할 수 있는 예입니다. 일관성은 트랜잭션이 실행된 후 데이터베이스의 무결성 제약 조건이 파괴되지 않으며 트랜잭션 실행 전후의 데이터 상태가 합법적이라는 것을 의미합니다. 데이터베이스의 무결성 제약 조건에는 엔터티 무결성(예: 행의 기본 키가 존재하고 고유함), 열 무결성(예: 필드의 유형, 크기 및 길이가 요구 사항을 충족해야 함)이 포함되지만 이에 국한되지는 않습니다. , 외래 키 제약 조건 및 사용자 정의 무결성(예: 이체 전후에 두 계정의 잔액 합계가 변경되지 않고 유지되어야 함) 일관성은 트랜잭션이 추구하는 궁극적인 목표라고 할 수 있습니다. 위에서 언급한 원자성, 지속성 및 격리성은 모두 데이터베이스 상태의 일관성을 보장하기 위한 것입니다. 또한 일관성을 구현하려면 데이터베이스 수준의 보장 외에도 애플리케이션 수준의 보장도 필요합니다. 일관성을 달성하기 위한 조치는 다음과 같습니다. 원자성, 내구성 및 격리를 보장합니다. 이러한 특성을 보장할 수 없으면 트랜잭션의 일관성도 보장할 수 없습니다. 데이터베이스 자체는 열 재구성을 허용하지 않는 등의 보장을 제공합니다. 삽입 문자열 값, 문자열 길이는 열 제한을 초과할 수 없습니다. 어플리케이션 수준에서 이를 보장합니다. 예를 들어 이체 작업이 송금인의 잔액만 공제하고 수신자의 잔액을 늘리지 않는 경우. 데이터베이스가 얼마나 완벽하게 구현되었는지, 상태가 일관적이라는 보장은 없습니다 다음은 ACID 특성과 구현 원칙을 요약합니다. 원자성: 명령문이 완전히 실행되거나 실행되지 않습니다. 트랜잭션의 핵심 기능인 트랜잭션 원자성에 의해 정의됩니다. 구현은 주로 실행 취소 로그 지속성: 트랜잭션 제출 후 다운타임 및 기타 이유로 인해 데이터가 손실되지 않도록 보장합니다. 구현은 주로 리두 로그 격리를 기반으로 합니다. 실행은 가능한 다른 트랜잭션의 영향을 받지 않습니다. InnoDB의 기본 격리 수준은 RR입니다. RR의 구현은 주로 잠금 메커니즘, 데이터의 숨겨진 열을 기반으로 합니다. 실행 취소 로그 및 다음 키 잠금 메커니즘 일관성: 트랜잭션의 궁극적인 추구 목표, 일관성 실현에는 데이터베이스 수준 보장과 애플리케이션 수준 보장이 모두 필요합니다 6. 요약
5. 일관성
1. 기본 개념
2. 구현
6. 요약
위 내용은 MySQL 트랜잭션의 ACID 특성 구현 원리에 대한 자세한 소개(그림 및 텍스트)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!