基于 Linux 集群环境上 GPFS 的问题诊断(2)

 node1:~ # mmgetstate -a 
 
 Node number Node name    GPFS state 
 ------------------------------------------ 
    1   node1      active 
    2   node2      arbitrating 
    3   node3      down 

  2. 查看 GPFS 文件系统是否出现了问题:

  因为所有文件系统必须在被挂载后才能使用,因此我们可以通过 df 命令来查看集群环境中某节点上所有文件系统的情况。正常情况下,通过 df 命令查看时,每个文件系统后都会显示相应的挂载点。当不能正常显示时,就表明该文件系统出现了问题。从下例中我们可以看到 /tiam/col1 文件系统出现了问题:

 node1:/ # df 
 Filesystem      1K-blocks   Used  Available  Use%  Mounted on 
 /dev/sda2      153786688  8750488  137224196   6%   / 
 udev        4088080    212   4087868    1%   /dev 
 df: `/tiam/col1': Stale NFS file handle 
 /dev/tiam_utility    31457280  2754816  28702464   9%   /tiam_utility 
 /dev/col2      602931200  29118208  573812992   5%  /tiam/col2 
 /dev/col3      619646976  33665024  585981952   6%  /tiam/col3 

  需要注意的是,要在 GPFS 集群系统中的每个节点上都进行检查。

  3. 查看磁盘空间是否满了:

  不少情况下 GPFS 发生问题,都是因为空间满了造成的。因为如果空间满了后 GPFS 就会停止工作。所以在进一步查看问题之前,确认磁盘空间是否已满是十分重要的一步。同样,也可用 df 命令进行检查,它可以检查文件系统的已用磁盘空间、空闲磁盘空间和使用率等情况。并且需要在每个节点上都进行检查。从下例中可以看出节点 1 上的根目录已满:

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/26954.html