Rumah > Artikel > pangkalan data > Oracle RAC ocr进行备份和恢复的一次错误操作(没关闭所有节点)
在看张晓明大师的《大话RAC》OCR命令部分的时候,由于自己拙,不细心的缘故,所有两个节点中,我只关闭了其中一个,就进行export,还有dd裸设备,所以备份恢复出现了错误!!深刻教训,后来成功恢复了,所以记录之。此记录不是规范的OCR备份恢复操作,规范的
在看张晓明大师的《大话RAC》OCR命令部分的时候,由于自己眼拙,不细心的缘故,所有两个节点中,我只关闭了其中一个,就进行export,还有dd裸设备,所以备份恢复出现了错误!!深刻教训,后来成功恢复了,所以记录之。此记录不是规范的OCR备份恢复操作,规范的请详见张大师的《大话RAC》著作。
redhat 5.5 +oracle 10.2.0.1.0
错误如下提示:
[root@rac1 ~]# /oracle/clusterware/cluvfy/runcluvfy.sh comp ocr -n all
验证 OCR 完整性
ERROR:
等同用户在所有节点上都不可用。
验证无法继续。
在所有节点上验证 OCR 完整性 失败。
ORACLE推荐在对集群作调整时,比如增加、删除节点之前,应该对OCR做一个备份,可以使用export备份到指定文件。如果做了replace或restore等操作,Oracle建议使用“cluvfy comp ocr -n all"命令做一次全面的检查。
(1)首先关闭所有节点的CRS
......
.......
-----引自张晓明 《大话RAC》
原因:由于只关闭一节点进行导出备份,两个节点不同步致错。
错误重现:
1、停止节点1的CRS资源
[root@rac1 ~]# /oracle/product/crs/bin/crsctl stop crs
Stopping resources.
Successfully stopped CRS resources
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.
2、导出OCR内容
[root@rac1 ~]# /oracle/product/crs/bin/ocrconfig -export /oracle/ocr.exp
[root@rac1 ~]# /oracle/product/crs/bin/crsctl start crs
Attempting to start CRS stack
The CRS stack will be started shortly
一定要root用户
3、启动节点1的CRS资源
[root@rac1 ~]# /oracle/product/crs/bin/crsctl start crs
Attempting to start CRS stack
The CRS stack will be started shortly
4、检查CRS状态
[root@rac1 ~]# /oracle/product/crs/bin/crsctl check crs
CSS appears healthy
CRS appears healthy
EVM appears healthy
(耐心稍等片刻 CRS进程才会起来)
5、破坏OCR内容
[root@rac1 ~]# dd if=/dev/zero of=/dev/raw/raw1 bs=1024 count=102400
102400+0 records in
102400+0 records out
104857600 bytes (105 MB) copied, 10.2297 seconds, 10.3 MB/s
6、检查OCR一致性
[root@rac1 ~]# /oracle/product/crs/bin/ocrcheck
PROT-601: Failed to initialize ocrcheck
显示失败
7、使用cluvfy工具检查一致性
[root@rac1 ~]# /oracle/clusterware/cluvfy/runcluvfy.sh comp ocr -n all
验证 OCR 完整性
无法从 Oracle 集群件中检索节点列表。
验证无法继续。
8、使用import恢复OCR内容
[root@rac1 ~]# /oracle/product/crs/bin/ocrconfig -import /oracle/ocr.exp
9、再次检查OCR
[root@rac1 ~]# /oracle/product/crs/bin/ocrcheck
Status of Oracle Cluster Registry is as follows :
Version : 2
Total space (kbytes) : 497928
Used space (kbytes) : 3800
Available space (kbytes) : 494128
ID : 1324903426
Device/File Name : /dev/raw/raw1
Device/File integrity check succeeded
Device/File not configured
Cluster registry integrity check succeeded
检查通过
10、用cluvfy工具检查
[root@rac1 ~]# /oracle/clusterware/cluvfy/runcluvfy.sh comp ocr -n all
验证 OCR 完整性
ERROR:
等同用户在所有节点上都不可用。
验证无法继续。
在所有节点上验证 OCR 完整性 失败。
问题出现,原因如上,因为节点2的CRS服务正在启动,所以导出恢复一定要停止所有节点。
解决办法:
1、检查节点1、节点2的CRS资源
[root@rac1 bin]# /oracle/product/crs/bin/crsctl check crs
CSS appears healthy
CRS appears healthy
EVM appears healthy
[root@rac2 ~]# /oracle/product/crs/bin/crsctl check crs
CSS appears healthy
CRS appears healthy
EVM appears healthy
2、停止1、2正在运行的CRS资源
[root@rac2 ~]# /oracle/product/crs/bin/crsctl stop crs
Stopping resources.
Successfully stopped CRS resources
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.
3、用dd命令清除掉存放OCR信息的裸设备
[root@rac2 ~]#dd if=/dev/zero of=/dev/raw/raw1 bs=1024 count=102400
102400+0 records in
102400+0 records out
104857600 bytes (105 MB) copied, 9.76807 seconds, 10.7 MB/s
4、检查OCR内容
[root@rac2 ~]# /oracle/product/crs/bin/ocrcheck
PROT-601: Failed to initialize ocrcheck
初始化失败
3、先停止CRS资源,然后用import命令执行导入操作
由于上步已停止CRS,所以直接import
[root@rac1 bin]# /oracle/product/crs/bin/ocrconfig -import /oracle/ocr.exp
如果不停止资源就import的话就出现如下错误
[root@rac1 bin]# /oracle/product/crs/bin/ocrconfig -import /oracle/ocr.exp
PROT-19: Cannot proceed while clusterware is running. Shutdown clusterware first
4、检查1、2节点的ocr内容
[root@rac1 bin]# /oracle/product/crs/bin/ocrcheck
Status of Oracle Cluster Registry is as follows :
Version : 2
Total space (kbytes) : 497928
Used space (kbytes) : 3800
Available space (kbytes) : 494128
ID : 774037276
Device/File Name : /dev/raw/raw1
Device/File integrity check succeeded
Device/File not configured
Cluster registry integrity check succeeded
[root@rac2 ~]# /oracle/product/crs/bin/ocrcheck
Status of Oracle Cluster Registry is as follows :
Version : 2
Total space (kbytes) : 497928
Used space (kbytes) : 3800
Available space (kbytes) : 494128
ID : 1472647163
Device/File Name : /dev/raw/raw1
Device/File integrity check succeeded
Device/File not configured
Cluster registry integrity check succeeded
[root@rac2 ~]# su - oracle
[oracle@rac2 cluvfy]$ /oracle/clusterware/cluvfy/runcluvfy.sh comp ocr -n all
验证 OCR 完整性
正在检查 OCR 完整性...
正在检查是否缺少非集群配置...
所有节点都没有非集群的, 仅限本地的配置。
OCR 设备的唯一性检查已通过。
正在检查 OCR 的版本...
正确版本 "2" 的 OCR 存在。
正在检查 OCR 数据完整性...
OCR 数据完整性检查已通过。
OCR 完整性检查已通过。
OCR 完整性 的验证成功。
6、切回节点一启动CRS资源,并检查资源状态
[root@rac1 ~]# /oracle/product/crs/bin/crsctl start crs
Attempting to start CRS stack
The CRS stack will be started shortly
[root@rac1 ~]# /oracle/product/crs/bin/crsctl check crs
CSS appears healthy
CRS appears healthy
EVM appears healthy
7、在节点1重复第五步
[root@rac1 ~]# su - oracle
[oracle@rac1 cluvfy]$ /oracle/clusterware/cluvfy/runcluvfy.sh comp ocr -n all
验证 OCR 完整性
正在检查 OCR 完整性...
正在检查是否缺少非集群配置...
所有节点都没有非集群的, 仅限本地的配置。
OCR 设备的唯一性检查已通过。
正在检查 OCR 的版本...
正确版本 "2" 的 OCR 存在。
正在检查 OCR 数据完整性...
OCR 数据完整性检查已通过。
OCR 完整性检查已通过。
OCR 完整性 的验证成功。
8、启动节点2的CRS资源,并检查状态
[root@rac2 ~]# /oracle/product/crs/bin/crsctl start crs
Attempting to start CRS stack
The CRS stack will be started shortly
[root@rac2 ~]# /oracle/product/crs/bin/crsctl check crs
CSS appears healthy
CRS appears healthy
EVM appears healthy
Attempting to start CRS stack
The CRS stack will be started shortly
个人观点总结:
至此,OCR内容成功恢复,主要是做了replace和restore操作,就要停止所有节点来使用cluvfy工具进行全面检查才能使所有节点进行信息同步,才能成功启动CRS资源。(两个节点一关一闭执行dd raw操作也可能会有错,所以看书得仔细点了!!)
疑问一:节点一第一次在CRS资源启动的时候执行import不报错,而再第二次之后再在CRS资源启动的时候执行import就会出错,
此时Oracle会提示PROT-19: Cannot proceed while clusterware is running. Shutdown clusterware first,有时不必过分纠结原理,根据提示灵活应变即可。
疑问二:如出现以下错误 (背景:使用绝对路径方式停止CRS报错,真是莫名其妙,不知道这两种命令方式有何区别,幸好试了另一种就能停止掉CRS资源,真是坑得一逼)
[root@rac1 ~]# /oracle/product/crs/bin/crsctl stop crs
OCR initialization failed with invalid format: PROC-22: The OCR backend has an invalid format1、先用工具检查
[oracle@rac1 ~]$ /oracle/clusterware/cluvfy/runcluvfy.sh comp ocr -n all
2、进入到ORACLE_HOME下 在该目录下使用命令停止
[root@rac1 oracle]# su - oracle
[oracle@rac1 ~]$ su
口令:
[root@rac1 oracle]# pwd
/home/oracle
[root@rac1 oracle]# crsctl stop crs
Stopping resources.
Successfully stopped CRS resources
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.
----------------------------------------------------------------------------------------------
blog:http://blog.csdn.net/waycomecome
mail:waycomecome@gmail.com