node1:~ # mmgetstate -a
Node number Node name GPFS state
------------------------------------------
1 node1 active
2 node2 arbitrating
3 node3 down
2. 查看 GPFS 文件系统是否出现了问题:
因为所有文件系统必须在被挂载后才能使用,因此我们可以通过 df 命令来查看集群环境中某节点上所有文件系统的情况。正常情况下,通过 df 命令查看时,每个文件系统后都会显示相应的挂载点。当不能正常显示时,就表明该文件系统出现了问题。从下例中我们可以看到 /tiam/col1 文件系统出现了问题:
node1:/ # df
Filesystem 1K-blocks Used Available Use% Mounted on
/dev/sda2 153786688 8750488 137224196 6% /
udev 4088080 212 4087868 1% /dev
df: `/tiam/col1': Stale NFS file handle
/dev/tiam_utility 31457280 2754816 28702464 9% /tiam_utility
/dev/col2 602931200 29118208 573812992 5% /tiam/col2
/dev/col3 619646976 33665024 585981952 6% /tiam/col3
需要注意的是,要在 GPFS 集群系统中的每个节点上都进行检查。
3. 查看磁盘空间是否满了:
不少情况下 GPFS 发生问题,都是因为空间满了造成的。因为如果空间满了后 GPFS 就会停止工作。所以在进一步查看问题之前,确认磁盘空间是否已满是十分重要的一步。同样,也可用 df 命令进行检查,它可以检查文件系统的已用磁盘空间、空闲磁盘空间和使用率等情况。并且需要在每个节点上都进行检查。从下例中可以看出节点 1 上的根目录已满: