Heim  >  Artikel  >  Datenbank  >  So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

WBOY
WBOYnach vorne
2023-05-31 13:14:011596Durchsuche

1. Übersicht

Multiversions-Parallelitätskontrolle (MVCC) ist eine Parallelitätskontrolltechnologie. MVVC, das die Datenbank-Parallelitätskontrolle implementiert, ist untrennbar mit der Versionskette im Rückgängig-Protokoll verbunden, was durch die Verwaltung mehrerer Versionen von Datenzeilen erreicht wird.

Einfach ausgedrückt fragt die aktuelle Transaktion die Zeilen ab, die von einer anderen Transaktion geändert werden (wenn zu diesem Zeitpunkt gelesen wird, tritt ein fehlerhaftes Lesen auf), ohne zu sperren und zu warten, sondern die historische Version der zu lesen Daten. Reduzieren Sie die Reaktionszeit.

MVVC wird durch zwei Technologien implementiert: Protokoll rückgängig machen und Ansicht lesen.

2. Snapshot-Lesen und aktuelles Lesen

Die Implementierung von MVCC in MySQL InnoDB dient hauptsächlich der Verbesserung der Datenbank-Parallelitätsleistung und der Verwendung einer besseren Methode zur Bewältigung von Lese-/Schreibkonflikten Wenn ein Lese-Schreib-Konflikt vorliegt, kann kein sperrendes und nicht blockierendes gleichzeitiges Lesen erreicht werden. Dieses Lesen bezieht sich auf das Snapshot-Lesen und nicht auf das aktuelle Lesen. Der aktuelle Lesevorgang ist eigentlich ein Sperrvorgang.

1. Aktueller Lesevorgang

Um sicherzustellen, dass der gelesene Datensatz die neuesten Daten ist und um zu verhindern, dass andere gleichzeitige Transaktionen den Datensatz ändern, muss der Datensatz hinzugefügt werden Lesen von Lock.

Der gesperrte Lesevorgang wird als aktueller Lesevorgang bezeichnet. Das Hinzufügen, Löschen und Ändern von Daten muss zuerst gelesen werden. Dieser Lesevorgang ist auch der aktuelle Lesevorgang.

SELECT * FROM t LOCK IN SHARE MODE; # 共享锁
SELECT * FROM t FOR UPDATE; # 排他锁
UPDATE SET t..

2. Snapshot-Lesen

Snapshot-Lesen wird auch als konsistentes Lesen bezeichnet, das die Snapshot-Version der Datenzeile liest. In MySQL verwenden gewöhnliche Select-Anweisungen (Select-Anweisungen ohne Aktualisierung oder Sperre im Freigabemodus) standardmäßig das Lesen von Snapshots ohne Sperre.

SELECT * FROM table WHERE ...

Der Grund dafür ist, dass das Lesen von Snapshots Sperrvorgänge vermeiden und den Overhead reduzieren kann.

Wenn die Isolationsstufe der Transaktion seriell ist, ist das Snapshot-Lesen nutzlos und wird auf das aktuelle Lesen reduziert.

3. Überprüfung der Isolationsstufe und Versionskette

Isolationsstufe:

Die Standardisolationsstufe in MySQL ist wiederholbares Lese-RR, das gelöst werden kann Nicht wiederholbares Leseproblem. In MySQL wird spezielle Unterstützung zur Lösung des Phantomleseproblems bereitgestellt.

Wie löst es das Phantomleseproblem? Es gibt zwei Möglichkeiten:

  • Verwenden Sie Lückensperren und temporäre Schlüsselsperren, um das Problem zu lösen. Während dieser Zeit können keine Daten von anderen Transaktionen eingefügt werden. 🎜🎜 #

  • MVCC-Methode, keine Sperre erforderlich, geringer Verbrauch (der Nachteil besteht darin, dass das Phantomleseproblem dadurch nicht vollständig gelöst wird).

Protokollversionskette rückgängig machen:

Entsprechend InnoDB enthält jeder Datensatz im Clustered-Index zwei notwendige versteckte Felder:

# 🎜🎜#

    trx_id: Jedes Mal, wenn eine Transaktion einen Clustered-Index-Datensatz ändert, wird die Transaktions-ID der Transaktion der ausgeblendeten Spalte trx_id zugewiesen.
  • roll_pointer: Rollback-Zeiger. Bei jeder Änderung der Daten werden die alten Daten in das Rückgängig-Protokoll eingefügt und die neuen Daten verweisen auf die alten Daten In einer Versionskette wird dieses Zeigerfeld als Rollback-Zeiger bezeichnet, über den die Daten vor der Änderung gefunden werden können.
  • Beispiel:

Eine Transaktion mit der ID 8 erstellt ein Datenelement, dann sieht das schematische Diagramm des Datensatzes wie folgt aus: #🎜 🎜#

Angenommen, dass zwei Transaktionen mit den IDs 10 bzw. 20 diesen Datensatz aktualisieren: So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

#🎜🎜 #

Angelegenheiten 10 Angelegenheiten 20BEGIN;#🎜🎜 # ####🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜#🎜🎜#begin;#🎜🎜 ## 🎜🎜 ## 🎜🎜#Update Student Set name='李思' WHERE id=1;UPDATE student SET name='王五' WHERE id=1;# 🎜🎜# 🎜# # 🎜🎜#UPDATE student SET name='Zhao Liu' WHERE id=1; UPDATE student SET name= 'Qianqi' WHERE id=1;COMMIT;#🎜🎜 #

每个修改都会生成一个undo log日志,并与其他日志相互链接形成版本链,从而呈现出该条数据的图示

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

每个版本中还包含生成该版本时对应的事务id 。

四、Read View

有了undo log就可以读取到记录的历史版本,那么在什么情况下,读取哪个版本的记录呢?这就用到了Read View,它帮我们解决了行的可见性问题。

读视图是指在使用MVCC机制进行快照读操作时产生的事务视图。这个视图是对当前数据库中所有活跃的、尚未提交的事务ID列表进行拍照的。

1.实现原理

四种隔离级别里,读未提交和串行化是不会使用MVVC的,因为读未提交直接读取某个数据的最新数据即可,串行化是通过加锁来读的。

读已提交和可重复读都必须保证读到的数据都是其他事务提交了的,所以,其他事务修改了数据但是还未提交,我们不能够访问该数据,但可以通过MVVC机制读取该记录的历史版本,核心问题就是需要判断版本链中的哪条历史版本是当前事务可见的,这也是ReadView要解决的问题。

Read View包含4个比较重要的内容:

  • creator_trx_id:创建这个Read View的事务id,Read View和事务是一一对应的。

当事务对表中的记录作出修改时,才会分配一个事务ID,否则如果事务仅进行读取操作,则该事务的ID默认为0。

  • trx_ids:表示在生成Read View时当前系统中活跃的事务id列表。提交了的事务不在其中。

  • up_limit_id:活跃的事务中最小的事务id。

  • low_limit_id:表示生成Read View时系统应该分配给下一个事务的id值,同样也表示系统中最大的事务id值。

请注意,低限制事务ID不一定是trx_ids中的最大值,因为事务ID是按递增顺序分配的。例如,有三个事务的id分别为1、2、5,其中id为5的事务提交了。那么一个新的读事务在生成ReadView时, trx_ids就包括1和2,up_limit_id的值就是1,low_limit_id的值就是6。

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

2.Read View规则

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

版本链

当某个事务有了Read View,访问某条记录时,需要按照下面的步骤判断该记录的哪个版本可见:

  • 如果该版本记录的trx_id和Read View的creator_trx_id相同,意味着该版本的记录是由当前事务修改的,因此该版本可以被当前事务访问

  • 如果该版本记录的trx_id小于Read View的up_limit_id,证明当前事务生成Read View时,此事务已经提交了,所以当前事务可以读取该版本。

  • 如果该版本的trx_id大于等于low_limit_id,证明生成该版本的事务在当前事务生成Read View之后才开启,所以该版本不可以被当前事务访问。

  • 如果被访问版本的trx_id属性值在ReadView的up_limit_id和low_limit_id之间,那就需要判断一下trx_id属性值是不是在trx_ids列表中,如果不在的话才能访问,否则不能访问。

3.整体流程

了解了这些概念之后,我们来看下当查询一条记录的时候,系统如何通过MVCC找到它:

  • 首先获取事务自己的版本号,也就是事务ID;

  • 获取 ReadView;

  • 查询得到的数据,然后与 ReadView 中的事务版本号进行比较;

  • 如果不符合 ReadView 规则,就需要从Undo Log中获取历史快照;

  • 最后返回符合规则的数据。

在隔离级别为读已提交时,一个事务中的每一次SELECT查询都会重新获取一次Read View,而可重复读是第一SELECT操作才会生成Read View,之后的查询操作复用这一个。

导致这两种的差距是因为:可重复读要保证一个事务中相同的SELECT读取的内容是相同的。

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

五、举例

1.READ

COMMITTED隔离级别下

现在有两个事务id分别为10、20的事务在执行:

-- id为10的事务
begin;
update t set name='李四' where id=1;
update t set name='王五' where id=1;
-- id为20的事务
更新其他行的数据

此刻,表中id为1的记录得到的版本链表如下所示:

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

此时新来一个事务执行如下操作:

begin;
select * from t where id=1;
-- 事务10、20未提交

查询到的结果为张三。

具体的过程如下:

  • 在执行select语句前,先生成一个Read View,Read View的creator_trx_id为0,trx_ids列表的内容是[10,20],up_limit_id为10,low_limit_id为21。

  • 查询name为王五的最新版本的记录,按规则进行对比,因为trx_id为10,10刚好是trx_ids中的记录,所以这条记录对当前事务不可见,根据回滚指针得到下一个版本

  • 下一个版本name为李四,也不行

  • 继续找到name为张三的版本,trx_id为8,8小于up_limit_id,所以该版本对当前事务可见,得到最终结果

接下来,再将id为10的事务进行commit提交。然后id为20的事务来更新记录:

begin;
-- id为20的事务
update t set name='赵六' where id=1;
update t set name='钱七' where id=1;

此时版本链更新为:

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

再到刚才使用READ COMMITTED隔离级别的事务中继续查找这个id 为1的记录,得到的结果为name=王五的那条记录。执行过程如下:

  • 生成Read View,Read View的creator_trx_id为0,trx_ids列表的内容是[20],up_limit_id为20,low_limit_id为21。

  • 因为前两个版本的记录trx_id为20,存在trx_ids中,所以跳过

  • 到第三条记录时,trx_id为10,小于20,可以读取,所以最终结果为王五

注意:READ COMMITTED,每次读取数据前都生成一个新的ReadView。

2.REPEATABLE READ隔离级别下

假如此时id为10的事务和id为20的事务正在修改,都未提交,修改内容和前面的一样,但是还未提交,此时当前事务做一个查询。

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

步骤为:

  • 生成Read View,Read View的creator_trx_id为0,trx_ids列表的内容是[10,20],up_limit_id为10,low_limit_id为21。

  • trx_id为10和20的都不满足要求

  • 最后查找到name为张三的历史版本的数据

此时,id为10的记录提交事务。

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

当前事务又需要select id为1的记录,步骤为:

  • 因为是可重复读,且第一次select已经生成过Read View了,所有会复用它,不重新生成。

  • 所以trx_id为10和20的记录依旧不符合规则,最终得到的数据还是张三,符合可重复读的规范

注意:REPEATABLE READ,每次读取都复用第一次生成的Read View

3.如何解决幻读

假设现在有一条数据,id为1

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

当前活跃的事务有10和20。

此时当前事务启动了,执行如下SQL语句:

begin;
select * from student where id>=1;

在开始前生成Read View,内容如下:creator_trx_id=0,trx_ids= [10,20] , up_limit_id=10, low_limit_id=21。

由于id大于等于1的数据只有一个,且该数据的trx_id为8,小于up_limit_id,所以可以读取到。

在这之后id为10的事务新增了一行数据,增加了id为2的数据,且提交了。

So implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC

此时当前线程继续查找id>=1的数据,因为是可重复读,复用刚刚的Read View。

得到两行数据,但是因为id为2的数据trx_id为10,该值在Read View的trx_ids中存在,所以该记录对当前事务不可见,所以最后查询到的数据只有一条记录。

如果当前事务再插入id为2的数据就插不进去,所以说MVVC只解决了一半的幻读问题。

COMMIT;
# 🎜🎜#

Das obige ist der detaillierte Inhalt vonSo implementieren Sie die Parallelitätskontrolle für mehrere Versionen von MySQL MVVC. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:yisu.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen