Heim >Datenbank >MySQL-Tutorial > 事务复制中的snapshot
事务复制中的snapshot Snapshotagent 读取 article 的信息,将 article 的内容和脚本放置到snapshot文件夹中; 接下来 distributionagent 会读取这些快照文件,传输到订阅,完成初始化操作。期间 distributionagent 需要处理很多事情,例如判断快照是否可用
事务复制中的snapshot
Snapshotagent读取article的信息,免备案空间,将article的内容和脚本放置到snapshot文件夹中; 接下来distributionagent会读取这些快照文件,传输到订阅,完成初始化操作。期间distributionagent需要处理很多事情,例如判断快照是否可用,需要应用那些快照文件,传输过程中发生中断怎么办 等等。这些都需要distributionagent来协调。读完本文之后您会对这些处理方式有所了解,也会帮助您更好地判断当前事务复制的状态以及进行错误排查。
在此之前,我要先简单地介绍一下distributionagent的工作方式:
Distributionagent包含两个进程,香港服务器,reader和writer。 Reader负责从distribution 数据库中读取数据,Writer负责将reader读取的数据写入到订阅数据库.
reader是通过sp_MSget_repl_commands来读取distribution数据库中(读取Msrepl_transactions表和Msrepl_Commands表)的数据
下面是sp_MSget_repl_commands的参数定义
CREATE PROCEDURE sys.sp_MSget_repl_commands
(
@agent_id int,
@last_xact_seqno varbinary(16),
@get_count tinyint = 0, -- 0 = no count, 1 = cmd and tran (legacy), 2 = cmd only
@compatibility_level int = 7000000,
@subdb_version int = 0,
@read_query_size int = -1
)
这个存储过程有6个参数,在Transactionalreplication 中,只会使用前4个(并且第三个参数和第四个参数的值是固定不变的.分别为0和10000000)。下面是一个例子:
@agent_id表示distributionagentid,每个订阅都会有一个单独的distributionagent来处理数据。 带入@agent_id后,就可以找到订阅对应的publication 和所有的article。
@last_xact_seqno 表示上一次传递到订阅的LSN。
大致逻辑是:Reader读取分发数据库中LSN大于@last_xact_seqno的数据。 Writer将读取到的数据写入订阅,并更新订阅的LSN.( MSreplication_subscriptions表的 transaction_timestamp列)。然后Reader会继续用新的LSN来读取后续的数据,再传递给Writer,如此往复。在sp_MSget_repl_commands的处理过程中, Msrepl_Commands表(通过type列进行区分)的数据大致分为两种: 1快照产生的数据,2 正常更新产生的数据
现在基本知识介绍完毕,下面开始进入正题
如何判断快照是否可用
Distributionagent 会使用存储过程sp_MSsubscription_status(exec sp_MSsubscription_status @agendId)去判断当前快照的状态:
如果sync_method是native,那么status的值会被直接更新为2,
如何应用快照文件
Snapshot会在快照文件夹或alt_snapshot_folder生成快照文件,虚拟主机,那么distribution agent是如何找到这些文件并应用的呢?
MSrepl_commands表中,下面是snapshot产生后两张表的查询截图
那么这些内容代表什么意义呢?我们可以通过sp_browsereplcmds来查看 ,
use distribution
go
exec sp_browsereplcmds'0x0000001E0000008F001E','0x0000001E0000008F001E' .
表中的内容包含了snapshot文件的名称和路径, distribution agent就会据这些信息将snapshot应用到订阅数据库中。
如何判断是否需要应用快照
sp_MSget_repl_commands里的:
当第一次初始化时,订阅数据库的LSN(MSreplication_subscriptions表的 transaction_timestamp)小于快照文件对应的LSN,这样,所有大于订阅LSN(也包含了快照)的数据都会被同步到订阅。
接下来就有个问题了,假设发布添加了一个新的订阅数据库,新的订阅数据库需要distribution agent来帮助其完成初始化快照的步骤。于是生成了一个新的快照,这些快照的xact_seqn肯定是大于已存在的订阅的xact_seqno的。 但对于已经存在的订阅数据库,是不需要应用这些快照的.那么distribution agent是如何处理这种情况的呢?