开始安装过程一切正常,在安装CRS即将结束时需要root在两个节点上执行两个脚本,node2在执行最后一个脚本时报错,是public地址的问题,和老师PPT上描述的一样,手动执行vipca配置也一切正常,正常退出vipca后就在继续完成CRS安装的最后步骤时CRS助手报错了,“Oracle Cluster verification Utility”这项失败;

检查configToolAllCommands如下:

rac1-> cat configToolAllCommands
# Copyright (c) 1999, 2005, Oracle. All rights reserved.
/u01/app/oracle/product/10.2.0/crs_1/bin/racgons add_config rac1.oracle.com:6200  rac2.oracle.com:6200
/u01/app/oracle/product/10.2.0/crs_1/bin/oifcfg setif -global  eth0/192.168.10.0:public eth1/10.0.0.0:cluster_interconnect
/u01/app/oracle/product/10.2.0/crs_1/bin/cluvfy stage -post crsinst -n rac1,rac2

手动进行verification信息如下:

rac1-> /u01/app/oracle/product/10.2.0/crs_1/bin/cluvfy stage -post crsinst -n rac1,rac2

Performing post-checks for cluster services setup

Checking node reachability...
Node reachability check passed from node "rac1".


Checking user equivalence...
User equivalence check passed for user "oracle".

Checking Cluster manager integrity...


Checking CSS daemon...
Daemon status check passed for "CSS daemon".

Cluster manager integrity check passed.

Checking cluster integrity...


Cluster integrity check passed


Checking OCR integrity...

Checking the absence of a non-clustered configuration...
All nodes free of non-clustered, local-only configurations.

Uniqueness check for OCR device passed.

Checking the version of OCR...
OCR of correct Version "2" exists.

Checking data integrity of OCR...

ERROR:                                                      
OCR integrity results are inconsistent amongst the nodes.

OCR integrity found invalid for nodes: rac2        /*问题出在这了*/

OCR integrity found valid for nodes: rac1

OCR integrity check failed.

Checking CRS integrity...

Checking daemon liveness...
Liveness check passed for "CRS daemon".

Checking daemon liveness...
Liveness check passed for "CSS daemon".

Checking daemon liveness...
Liveness check passed for "EVM daemon".

Checking CRS health...
CRS health check passed.

CRS integrity check passed.

Checking node application existence...


Checking existence of VIP node application (required)
Check passed.

Checking existence of ONS node application (optional)
Check passed.

Checking existence of GSD node application (optional)
Check passed.


Post-check for cluster services setup was unsuccessful on all the nodes.


接着查看CRS日志:
[root@rac2 rac2]# cat alertrac2.log
2010-11-23 01:50:03.156
[client(7343)]CRS-1006:The OCR location /dev/raw/raw1 is inaccessible. Details in /u01/app/oracle/product/10.2.0/crs_1/log/rac2/client/ocrconfig_7343.log.
2010-11-23 01:50:03.164
[client(7343)]CRS-1006:The OCR location /dev/raw/raw1 is inaccessible. Details in /u01/app/oracle/product/10.2.0/crs_1/log/rac2/client/ocrconfig_7343.log.
2010-11-23 01:50:03.168
[client(7343)]CRS-1006:The OCR location /dev/raw/raw1 is inaccessible. Details in /u01/app/oracle/product/10.2.0/crs_1/log/rac2/client/ocrconfig_7343.log.
2010-11-23 01:50:03.226
[client(7343)]CRS-1001:The OCR was formatted using version 2.
2010-11-23 01:50:11.241
[client(7399)]CRS-1801:Cluster crs configured with nodes rac1 rac2 .
2010-11-23 01:52:27.597
[cssd(7851)]CRS-1605:CSSD voting file is online: /dev/raw/raw2. Details in /u01/app/oracle/product/10.2.0/crs_1/log/rac2/cssd/ocssd.log.
2010-11-23 01:52:31.776
[cssd(7851)]CRS-1601:CSSD Reconfiguration complete. Active nodes are rac1 rac2 .
2010-11-23 01:52:34.081
[crsd(7537)]CRS-1012:The OCR service started on node rac2.
2010-11-23 01:52:34.118
[evmd(7789)]CRS-1401:EVMD started on node rac2.
2010-11-23 01:52:36.817
[crsd(7537)]CRS-1201:CRSD started on node rac2.

原来是/dev/raw/raw1 is inaccessible!估计又是虚拟机的问题~~~
到此就基本定位了是OCR的问题了,并且是共享存储存在问题导致/dev/raw/raw1 is inaccessible

下面就是发挥想象力排错了,先把$ORA_CRS_HOME/bin 下所有关于ocr的命令出来研究一下....

发现有个检查ocr的命令ocrcheck,经检测,又一次验证了问题所在
[root@rac2 bin]# ./ocrcheck
Status of Oracle Cluster Registry is as follows :

Version                  :          2

Total space (kbytes)     :     200692

Used space (kbytes)      :       1980

Available space (kbytes) :     198712

ID                       : 1293702471

Device/File Name         : /dev/raw/raw1
                                    Device/File integrity check failed

                                    Device/File not configured


Cluster registry integrity check failed


[root@rac1 bin]# ./ocrcheck
Status of Oracle Cluster Registry is as follows :

Version                  :          2

Total space (kbytes)     :     200692

Used space (kbytes)      :       1980

Available space (kbytes) :     198712

ID                       : 1293702471

Device/File Name         : /dev/raw/raw1
                                    Device/File integrity check succeeded

                                    Device/File not configured


Cluster registry integrity check succeeded


后来又发现了ocrconfig,这个命令里有个-export,-import;目前node1是好的只是node2有问题,根据对RAC一知半解的概念分析OCR中的内容应该是同步的,估计在node1将OCR导出再导入到node2中应该没问题。但是从刚才的OCR检测信息看OCR还有个Version ,这么说貌似这个东西还在不停的变化中。
基于这两点考虑,决定在导入导出前将两个节点的CRS全关闭。
下面就是步骤了:


[root@rac1 bin]# ./crsctl stop crs
Stopping resources.
Successfully stopped CRS resources
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.

[root@rac2 bin]# ./crsctl stop crs
Stopping resources.
Successfully stopped CRS resources
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.

[root@rac1 bin]# ./ocrconfig -export /root/ocr.dmp

[root@rac2 bin]# ./ocrconfig -import /root/ocr.dmp

[root@rac1 bin]# ./crsctl start crs
Attempting to start CRS stack
The CRS stack will be started shortly

[root@rac2 bin]# ./crsctl start crs
Attempting to start CRS stack
The CRS stack will be started shortly

[root@rac2 bin]# ./crs_stat -t -v
Name           Type           R/RA   F/FT   Target    State     Host        
----------------------------------------------------------------------
ora.rac1.gsd   application    0/5    0/0    ONLINE    ONLINE    rac1        
ora.rac1.ons   application    0/3    0/0    ONLINE    ONLINE    rac1        
ora.rac1.vip   application    0/0    0/0    ONLINE    ONLINE    rac1        
ora.rac2.gsd   application    0/5    0/0    ONLINE    ONLINE    rac2        
ora.rac2.ons   application    0/3    0/0    ONLINE    ONLINE    rac2        
ora.rac2.vip   application    0/0    0/0    ONLINE    ONLINE    rac1

[root@rac2 bin]# ./ocrcheck
Status of Oracle Cluster Registry is as follows :

Version                  :          2

Total space (kbytes)     :     200692

Used space (kbytes)      :       1980

Available space (kbytes) :     198712

ID                       :  161137417

Device/File Name         : /dev/raw/raw1
                                    Device/File integrity check succeeded

                                    Device/File not configured


Cluster registry integrity check succeeded


居然搞定了~但是个人认为一半是瞎搞,请老师再深入剖析一下吧!
此为梦游作,逻辑混乱,错别字等,请海涵!

本帖被以下淘专辑推荐:

标签: 暂无标签
fanchungang

写了 4 篇文章,拥有财富 45,被 1 人关注

转播转播 分享分享 分享淘帖1
回复

使用道具

P4 | 发表于 2010-11-23 10:42:55
学习了,LZ有很强的分析问题并解决问题的能力呀,支持原创!这个问题我很早以前也遇到过,应该是由于虚拟机对共享存储支持不好造成的,以往我都是重启两个虚拟机就好了,没有像LZ这样具体分析过,看来人和人的差别很大呀!
回复

使用道具

P4 | 发表于 2010-11-24 01:23:26
一般我接触一些不太熟悉的东西的时候,比较喜欢留意它的日志,我觉得多看看日志有助于对一个东西的更深入形象的认识。个人经验,呵呵~
回复

使用道具

P4 | 发表于 2010-11-24 01:24:31
期待老师进一步剖析的帖子啊~
回复

使用道具

P4 | 发表于 2012-10-29 09:59:19
最近在实践当中也碰到这个问题,个人的感觉也是磁盘共享存在的问题。我的思想是我们在安装grid的时候在选择votedisk时选择的路径有问题,我这里是用asm来管理的所以我在选择磁盘的时候选择/dev/oracleasm/disk/下的磁盘就不会报任何的错误,而默认的磁盘选择路径是/dev/raw* ,不知做的对不对但是我安装我的做下去没有报任何的错误!想问下老师,楼主,各位朋友是不是在应用asm来管理的时候在选择votedisk时需要有什么注意的地方!
回复

使用道具

您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

意见
反馈