[root@sqdb2 ~]# service cman start
Starting cluster:
Loading modules... done
Mounting configfs... done
Starting ccsd... done
Starting cman... failed
cman not started: Can't find local node name in cluster.conf /usr/sbin/cman_tool: aisexec daemon didn't start
[FAILED]
查看配置文件,发现配置原配置版本为15变为10,版本10的配置文件为新增另一套双机的配置文件。
[root@sqdb2 ~]# more /etc/cluster/cluster.conf
<?xml version="1.0"?>
<cluster alias="sqdb" config_version="10">
.......
<failoverdomain restricted="1">
<failoverdomainnodeCOLOR: #ff0000">intf1.fjnet114.com" priority="1"/>
<failoverdomainnodeCOLOR: #ff0000">intf2.fjnet114.com" priority="1"/>
</failoverdomain>
......
</cluster>
原配置文件如下:
<cluster alias="sqdb" config_version="15">
........
<failoverdomain restricted="1">
<failoverdomainnodeCOLOR: #ff0000">sqdb1.fjnet114.com" priority="1"/>
<failoverdomainnodeCOLOR: #ff0000">sqdb2.fjnet114.com" priority="1"/>
</failoverdomain>
......
</cluster>
[root@sqdb2 ~]# scp sqdb1.fjnet114.com:/etc/cluster/cluster.conf /etc/cluster/cluster.conf
手工同步sqdb1的群集配置文件至sqdb2,并确认群集文件为昨日正常的版本15。
重启cman报错依旧,配置文件再次自动修改为版本10。
[root@sqdb2 ~]# service cman start
Starting cluster:
Loading modules... done
Mounting configfs... done
Starting ccsd... done
Starting cman... failed
cman not started: Can't find local node name in cluster.conf /usr/sbin/cman_tool: aisexec daemon didn't start
[FAILED]
分析处理与总结:
再次同步sqdb1群集配置文件至sqdb2,并修改新增另一群集的群集名为非sqdb,问题解决。
原来RHCS会在同一网络中找相同群集名,同时cman服务启用的群集配置文件,即使对方版本号低于本机的群集文件版本,也会同步到本机。如本案例中,version=15并同步为version=10。
今后,在同一个网段内配置多套RHCS cluster时,要事先规划好cluster_name,千万不要有相同的cluster_name,以免出现各种奇怪的问题。