分布式文件MFS 高可用集群(3)

4 整合drbd heartbeat moosefs元数据服务器(mfsmaster),注意的是,当主节点出现故障恢复正常是不让其自动收回资源,因为drbd易出现split   

brain 现象

#vim  /etc/ha.d/haresource

mfsmaster drbddisk::mfs  Filesystem::/dev/drbd0::/mfsdata::ext3 mfsd::  IPaddr::192.168.2.100/24/eth0

5  并把drbd 及heartbeat,mfsd 添加到开机启动队列中

#cp  /etc/ha.d/resource/mfsd  /etc/init.d/mfsd

#chmod 700 /etc/init.d/mfsd

#chkconfig   --add  mfsd

#chkconfig   mfsd on

#chkconfig  heartbeat on

#chkconfig   mfsd on

第六 出现的问题,如下               

在该集群上eth1 为mfsmaster和mfsback 进行数据同步,由于网络的不稳定,易造成DRBD 出现split brain 现象,

如下

1 测试发生split brain 情况

[root@mfsmaster ~]#   ifdown  eth1 注:一段时间后在启动该网卡(ifup  eth1)drbd 同步eth1 进行数据同步

并查看 在mfsmaster

[root@mfsmaster ~]# cat /proc/drbd

version: 8.3.10 (api:88/proto:86-96)

GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by root@mfsmaster, 2011-02-28 11:31:28

0: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown   r-----

ns:40 nr:0 dw:856 dr:2090 al:9 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:784

2  在mfsback

[root@mfsback ~]# cat /proc/drbd

version: 8.3.10 (api:88/proto:86-96)

GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by root@mfsback, 2011-02-28 11:29:00

0: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown   r-----

ns:0 nr:40 dw:900 dr:1169 al:5 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:784

3 解决方法

首先关闭在主从节点上关闭heartbeat 不然不能恢复drbd 的正常连接

#service heartbeat stop

在mfsmaster 运行一下命令

#drbdadm  secondary resource(注:resource 为drbd的资源名)

#drbdadm  --  --discard-my-data  connect resource

在mfsback 上运行下面命令

#drbdadm  connect source

4 再次查看drbd的信息

查看mfsmaster 上的drbd的信息

#cat /proc/drbd

[root@mfsmaster~]# cat /proc/drbd

version: 8.3.10 (api:88/proto:86-96)

GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by root@mfsmaster, 2011-02-28 11:31:28

0: cs:Connected ro:Secondary/Secondary ds:UpToDate/UpToDate C r-----

ns:0 nr:2620 dw:4168 dr:2102 al:9 bm:5 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0

查看mfsback 上的drbd信息

[root@mfsback ~]# cat /proc/drbd

version: 8.3.10 (api:88/proto:86-96)

GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by root@mfsback, 2011-02-28 11:29:00

0: cs:Connected ro:Secondary/Secondary ds:UpToDate/UpToDate C r-----

ns:2620 nr:0 dw:1632 dr:4830 al:6 bm:6 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0

5 在主备节点上依次重启heartbeat

#service heartbeat  start

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/pxxpj.html