多套RHCS使用相通群集名异常处理

 [root@sqdb2 ~]# service cman start

Starting cluster:

   Loading modules... done

   Mounting configfs... done

   Starting ccsd... done

   Starting cman... failed

cman not started: Can't find local node name in cluster.conf /usr/sbin/cman_tool: aisexec daemon didn't start

[FAILED]

查看配置文件,发现配置原配置版本为15变为10,版本10的配置文件为新增另一套双机的配置文件。

[root@sqdb2 ~]# more /etc/cluster/cluster.conf

<?xml version="1.0"?>

<cluster alias="sqdb" config_version="10">

            .......

                      <failoverdomain restricted="1">

                                <failoverdomainnodeCOLOR: #ff0000">intf1.fjnet114.com" priority="1"/>

                                <failoverdomainnodeCOLOR: #ff0000">intf2.fjnet114.com" priority="1"/>

                        </failoverdomain>

               ......

   

</cluster>

 

原配置文件如下:

<cluster alias="sqdb" config_version="15">

 

........

                        <failoverdomain restricted="1">

                                <failoverdomainnodeCOLOR: #ff0000">sqdb1.fjnet114.com" priority="1"/>

                                <failoverdomainnodeCOLOR: #ff0000">sqdb2.fjnet114.com" priority="1"/>

                        </failoverdomain>

       ......

</cluster>

 [root@sqdb2 ~]# scp sqdb1.fjnet114.com:/etc/cluster/cluster.conf /etc/cluster/cluster.conf

手工同步sqdb1的群集配置文件至sqdb2,并确认群集文件为昨日正常的版本15。

重启cman报错依旧,配置文件再次自动修改为版本10。

[root@sqdb2 ~]# service cman start

Starting cluster:

   Loading modules... done

   Mounting configfs... done

   Starting ccsd... done

   Starting cman... failed

cman not started: Can't find local node name in cluster.conf /usr/sbin/cman_tool: aisexec daemon didn't start

[FAILED]

分析处理与总结:

     再次同步sqdb1群集配置文件至sqdb2,并修改新增另一群集的群集名为非sqdb,问题解决。

     原来RHCS会在同一网络中找相同群集名,同时cman服务启用的群集配置文件,即使对方版本号低于本机的群集文件版本,也会同步到本机。如本案例中,version=15并同步为version=10。

    今后,在同一个网段内配置多套RHCS cluster时,要事先规划好cluster_name,千万不要有相同的cluster_name,以免出现各种奇怪的问题。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/psjdd.html