服务器更换硬盘之后一定要检查RAID是否同步

近期再给一个用户更换服务器硬盘时发现,一是RAID配置错误,使用300GB的硬盘给600GB的磁盘做热备,另外是更换的硬盘型号不对导致数据没有同步。新近入职的管理员如果接手的有旧的服务器,有时间应重点检查一下硬盘及RAID信息,看是否有离线的硬盘或配置不合适的地方好及时纠正。

正文

今年4月上旬,有个单位的2台服务器硬盘坏了3块硬盘,客户让送3块600GB的硬盘并帮着给换一下。到了现场我看到了这两台服务器,其中一台服务器有2个硬盘亮黄灯(如图1所示),另一台服务器有1个硬盘亮黄灯(如图2所示)。

服务器更换硬盘之后一定要检查RAID是否同步

图1 2块硬盘亮黄灯

服务器更换硬盘之后一定要检查RAID是否同步

图2 1块硬盘亮黄灯

仔细一看,这两台服务器,每台都配置了1块300GB硬盘、3块600GB硬盘。当时比较奇怪怎么有这种配置,难道这块300GB的用来装系统、另3块600GB的做RAID-5存数据?

当时我和客户说,图1中这种坏了2块硬盘的可能需要做数据恢复了,因为3块硬盘的RAID-5中同时坏2块,此时换盘是不行了。当时这台服务器已经不能启动了(图2中的服务器还在使用,能进入系统)。

图1中坏2块硬盘的服务器,打开电源进入RAID界面,看到01、02槽位的硬盘为Failed状态,如图3所示。

服务器更换硬盘之后一定要检查RAID是否同步

图3 两块硬盘失败

按Ctrl + N组合键进入PD Mgmt之后整个人就有点晕了,槽位0的300GB硬盘竟然配置成了热备磁盘!如图4所示。

服务器更换硬盘之后一定要检查RAID是否同步

图4 300GB的硬盘被配置成了全局热备

客户说这台服务器已经使用多年,原来也坏过(一块)硬盘,换了之后就继续使用了。这次是系统不能用了才发现坏了两块硬盘的,以为换上就能继续使用了。当时这台服务器买的时候是1块300GB的硬盘,财务软件公司的人说一块硬盘不安全,又买了3块600GB的硬盘做的RAID-5,是软件公司的人给配置的。估计当时这个软件公司的人也不是很懂硬件,就这样配置上了。

另外一台服务器只坏了一块硬盘,换上硬盘之后数据开始同步。因为看到的第1台服务器RAID配置不合适,我重新启动服务器进入RAID卡配置模块,果然这块300GB的硬盘也被配置成了热备磁盘,如图5所示。同时新换上的硬盘已经开始重组数据。

服务器更换硬盘之后一定要检查RAID是否同步

图5 数据同步与热备磁盘配置

这是这台服务器更换硬盘后的相片,如图6所示。

服务器更换硬盘之后一定要检查RAID是否同步

图6 第2台服务器更换硬盘之后

这时客户说,还有一台服务器,年前换了一块硬盘,这次来了顺便帮着给检查一下,这一检查就又发现新的问题了。

第三台服务器也是3650 M5,在另一个机房,槽位3的硬盘是年前换的,这个机房明显环境好一些,服务器硬盘上的灰尘也少一些,如图7所示。

服务器更换硬盘之后一定要检查RAID是否同步

图7 槽位3的硬盘是年前换上的

重新启动进入RAID卡,300GB的硬盘还是配成了热备磁盘,又是熟悉的配方、熟悉的味道。但是,槽位3的硬盘是Unconfigured Good,这块硬盘没有同步,如图8所示。

服务器更换硬盘之后一定要检查RAID是否同步

图8 硬盘没有同步

仔细看图7,发现新换上的硬盘托架上的序号和原来的托架序号不同(图6中新换上的序号和原来的相同)。好在还有2块新买的硬盘暂时没有用上,取下年前购买的硬盘,换上这次带来的硬盘,此时硬盘开始重组数据,此时新换上的硬盘黄灯、绿灯交替闪烁,如图9所示。

服务器更换硬盘之后一定要检查RAID是否同步

图9 硬盘数据开始同步

在RAID界面中数据开始重组,如图10所示。

服务器更换硬盘之后一定要检查RAID是否同步

图10 数据重组

一个多小时之后数据重组完成,硬盘绿灯闪烁,此时这台服务器检查完成,如图11所示。

后期建议,如果客户需要热备磁盘,应该是每台取下原来300GB的硬盘,添加一块600GB的硬盘并重新配置成热备磁盘。

服务器更换硬盘之后一定要检查RAID是否同步

图11 硬盘状态正常

linux

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/07e7accb592168a1fd5b1ee0d6e9e4ee.html