4 整合drbd heartbeat moosefs元数据服务器(mfsmaster),注意的是,当主节点出现故障恢复正常是不让其自动收回资源,因为drbd易出现split
brain 现象
#vim /etc/ha.d/haresource
mfsmaster drbddisk::mfs Filesystem::/dev/drbd0::/mfsdata::ext3 mfsd:: IPaddr::192.168.2.100/24/eth0
5 并把drbd 及heartbeat,mfsd 添加到开机启动队列中
#cp /etc/ha.d/resource/mfsd /etc/init.d/mfsd
#chmod 700 /etc/init.d/mfsd
#chkconfig --add mfsd
#chkconfig mfsd on
#chkconfig heartbeat on
#chkconfig mfsd on
第六 出现的问题,如下
在该集群上eth1 为mfsmaster和mfsback 进行数据同步,由于网络的不稳定,易造成DRBD 出现split brain 现象,
如下
1 测试发生split brain 情况
[root@mfsmaster ~]# ifdown eth1 注:一段时间后在启动该网卡(ifup eth1)drbd 同步eth1 进行数据同步
并查看 在mfsmaster
[root@mfsmaster ~]# cat /proc/drbd
version: 8.3.10 (api:88/proto:86-96)
GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by root@mfsmaster, 2011-02-28 11:31:28
0: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown r-----
ns:40 nr:0 dw:856 dr:2090 al:9 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:784
2 在mfsback
[root@mfsback ~]# cat /proc/drbd
version: 8.3.10 (api:88/proto:86-96)
GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by root@mfsback, 2011-02-28 11:29:00
0: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown r-----
ns:0 nr:40 dw:900 dr:1169 al:5 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:784
3 解决方法
首先关闭在主从节点上关闭heartbeat 不然不能恢复drbd 的正常连接
#service heartbeat stop
在mfsmaster 运行一下命令
#drbdadm secondary resource(注:resource 为drbd的资源名)
#drbdadm -- --discard-my-data connect resource
在mfsback 上运行下面命令
#drbdadm connect source
4 再次查看drbd的信息
查看mfsmaster 上的drbd的信息
#cat /proc/drbd
[root@mfsmaster~]# cat /proc/drbd
version: 8.3.10 (api:88/proto:86-96)
GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by root@mfsmaster, 2011-02-28 11:31:28
0: cs:Connected ro:Secondary/Secondary ds:UpToDate/UpToDate C r-----
ns:0 nr:2620 dw:4168 dr:2102 al:9 bm:5 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
查看mfsback 上的drbd信息
[root@mfsback ~]# cat /proc/drbd
version: 8.3.10 (api:88/proto:86-96)
GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by root@mfsback, 2011-02-28 11:29:00
0: cs:Connected ro:Secondary/Secondary ds:UpToDate/UpToDate C r-----
ns:2620 nr:0 dw:1632 dr:4830 al:6 bm:6 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
5 在主备节点上依次重启heartbeat
#service heartbeat start