RAC后台进程介绍

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB원래의: 2016-06-07 16:04:38959검색

在RAC数据库上会比单实例数据库多一些进程，这些进程是RAC特有的，为了实现集群数据库功能而设置的。这篇文章会对RAC特有的进程做一些介绍。 1、LMSn: Global Cache Service Process。 LMSn进程会维护在Global Resource Directory (GRD)中的数据文件以及每个c

在RAC数据库上会比单实例数据库多一些进程，这些进程是RAC特有的，为了实现集群数据库功能而设置的。这篇文章会对RAC特有的进程做一些介绍。

1、LMSn: Global Cache Service Process。

LMSn进程会维护在Global Resource Directory (GRD)中的数据文件以及每个cached block的状态。LMSn用于在RAC的实例间进行message以及数据块的传输，这个对应的服务也就是GCS(Global Cache Service)，LMS是Cache Fusion的一个重要部分。LMS进程可以说是RAC上最活跃的后台进程，会消耗较多的CPU.一般每个实例会有多个LMS进程，每个Oracle版本的默认的LMS进程数目会有所不同，大部分版本的默认值是：MIN(CPU_COUNT/2, 2))

2、LMD: Global Enqueue Service Daemon。（对应的服务叫GES服务）

LMD 进程主要处理从远程节点发出的资源请求，在多个实例之间协调对数据块的访问顺序，保证数据的一致性访问，大概过程如下：

+ 一个连接发出了global enqueue 请求
+ 这个请求会被发给本节点的LMD0进程
+ 这个前台进程会处于等待状态
+ LMD0会找到这个资源的master节点是谁
+ LMD0会把这个请求发送给master节点
+ 如果需要的话，master节点会增加一个新的master资源
+ 这时从master节点可以获知谁是owner, waiter
+ 当这个资源被grant给requestor后, master节点的LMD0进程会告知requestor节点的LMD0
+ 然后requestor节点的LMD0会通知申请资源的前台进程

GCS服务与GES服务还有GRD共同构成了RAC的Cache Fusion（缓存融合）

缓存融合是RAC内部最复杂的一部分，其中数据块是如何通过private network在实例之间传递，如何控制访问顺序，这些都很复杂，有兴趣的同学可以研究

如上总结LMD主要处理global enqueue 的请求, 而LCK0主要处理本实例的lock.
另外，RAC上的global deadlock 也是由LMD来发现的。

3、LCK0: Instance Enqueue Process。

LCK0进程主要处理非cache fustion的资源请求，比如library 和row cache 请求。

LCK0处理在实例一级的锁：
Row cache entries
Library cache entries
Result cache entries
这些实例级的锁的owner, waiter是LCK0进程。
只要这个实例的锁的owner是LCK0，那么这个实例的任何一个连接都可以使用这种cached的metedata.
如果本地的实例没有拥有这个lock，那么需要申请这个lock，前台进程会等待DFS Lock Handle。
另外，当shared pool出现压力需要释放一些内存来存放新的cursor时，LCK进程会将dictionary cache 的一些内存进行释放。

4、LMON: Global Enqueue Service Monitor。

LMON用于监控整个集群的global enqueues和resources，而且会执行global enqueue recovery。实例异常终止后，会由LMON来进行GCS内存方面的处理。当一个实例加入或者离开集群后，LMON会对lock和resource进行reconfiguration.也就是说当某个节点出现故障时，LMON负责集群重构，GRD恢复等操作，另外LMON会在不同的实例间进行通讯检查，如果发现对方通讯超时，就会发出节点eviction，所以很多时候节点发生eviction后(ORA-481, ORA-29740等)，我们需要查看LMON的trace来了解eviction的原因。

LMON主要借助两种心跳机制完成健康检查：

1）节点之间网络心跳，可以简单理解为节点间定时发送ping包检测节点状态，如果规定时间能收到回应，就认为对方状态正常

2）通过控制文件磁盘心跳，每个节点的ckpt进程每3秒更新一次controlfile的数据快，由于controlfile是共享的，所以实例之间可以检查对方是否及时更新controlfile来判断对方的状态。

5、DIAG: Diagnostic Capture Process。

用来打印诊断信息。diag进程会响应别的进程发出的dump请求，将相关的诊断信息写到diag trace文件中。在RAC上，当发出global oradebug请求时，会由每个实例的diag进程来打印诊断信息到diag trace中。

比如：下面的命令用了“-g”,那么生成的dump信息会分别写到每个实例的diag trace文件中：
SQL>oradebug -g all hanganalyze 3
SQL>oradebug -g all dump systemstate 266

6、ASMB: ASM Background Process。

用于和ASM实例进行通讯，用来管理storage和提供statistics。当使用ASMCMD的cp命令时，需要用到ASM实例上的ASMB进程，数据库实例的spfile如果位于存于ASM上，那么也会用到ASMB进程。如果OCR存放在ASM中，也会用到ASMB。

7、RBAL：ASM Rebalance Master Process。

作为ASM磁盘组进行rebalance时的协调者(Coordinator)。在数据库实例上，由它来管理ASM磁盘组。

8、Onnn：ASM Connection Pool Process。

是从数据库实例连接到ASM实例上的一些连接池，通过这些连接池，数据库可以发送消息给ASM实例。比如，由它将打开文件的请求发送给ASM实例，这些连接池只处理一些较短的请求，不处理创建文件这种较长的请求。

------11G 特有的：

9、PING：Interconnect Latency Measurement Process。

用来检查集群中各个实例间的私网通讯状况。每个实例每隔几秒会发送给其它实例一些消息，这些消息会由其它实例的PING进程收到。发送和接收信息花费的时间会被记录下来并判断是否正常。

10、LMHB: Global Cache/Enqueue Service Heartbeat Monitor。

监控本地的LMON, LMD, LCK0,RMS0 and LMSn等进程是否运行正常，是否被阻塞或者已经hang了。

11、RMSn：Oracle RAC Management Process。

完成对RAC的一些管理任务，比如当一个新的实例加入到集群后，给这个实例创建相关的资源。

12、RSMN: Remote Slave Monitor Process。

管理后台的slave进程的创建，作为远程实例的协调者来完成一些任务。

13、GTXn: Global Transaction Process。

在RAC环境中对于XA 事务提供透明支持，维护在RAC中的XA事务的global信息，完成global事务的两阶段提交。

14、RCBG: Result Cache Background Process。

这个进程用来处理RAC上Result Cache相关的消息。

15、ACMS: Atomic Control File to Memory Service Process。

作为每个实例上的agent来保证SGA的更新在RAC的所有实例上都是同步的，或者是全局成功提交，或者由于一些问题而导致全局回滚。

성명：

이전 기사：利用Access实现学校课程表的科学管理다음 기사：access数据库密码找回方法详解

RAC后台进程介绍

관련 기사