HACMP 认证学习系列,第 4 部分:集群的验证和测(7)

可以使用 smitty clstop 来停止集群服务。可以选择您希望在其上停止集群服务的所有节点,以及停止类型:graceful、takeover 或 forced。

示例 6 演示了如何停止集群服务。


示例 6 停止集群服务 (smitty clstop)

HACMP 认证学习系列,第 4 部分:集群的验证和测


在一个节点上成功关闭集群服务以后,命令 lssrc -g cluster 的输出应该不包含任何内容。

还可以使用别名命令 lsha 来验证所有与集群相关的进程的状态。

示例 7 演示了如何验证与集群相关的服务的状态。

示例 7 验证集群停止

[p630n01][/]> lssrc -g cluster Subsystem Group PID Status [p630n01][/]> lssrc -g topsvcs Subsystem Group PID Status topsvcs topsvcs inoperative [p630n01][/]> lssrc -g emsvcs Subsystem Group PID Status emsvcs emsvcs inoperative emaixos emsvcs inoperative [p630n01][/]> lsha clcomdES clcomdES 14896 active topsvcs topsvcs inoperative grpsvcs grpsvcs inoperative grpglsm grpsvcs inoperative emsvcs emsvcs inoperative emaixos emsvcs inoperative  

请注意,clcomd 守护进程在集群服务停止以后仍在运行。

一个节点上的关闭类型将决定该节点在成功停止集群服务以后获取的资源组将来的行为。

在文件 /tmp/hacmp.out 中,查找 node_down 和 node_down_complete 事件。

示例 8 显示了一个示例 node_down 事件。

示例 8 Node_down 事件

:node_down[306] exit 0 Jun 30 16:14:40 EVENT COMPLETED:node_down p630n01 graceful HACMP Event Summary Event:node_down p630n01 graceful Start time:Wed Jun 30 16:14:28 2004 End time:Wed Jun 30 16:14:43 2004 Action:Resource:Script Name: Releasing resource group:rg01 process_resources Search on:Wed.Jun.30.16:14:30.EDT.2004.process_resources.rg01.ref Releasing resource:All_service_addrs release_service_addr Search on:Wed.Jun.30.16:14:32.EDT.2004.release_service_addr.All_service_addrs.rg01.ref Resource offline:All_nonerror_service_addrs release_service_addr Search on: Wed.Jun.30.16:14:35.EDT.2004.release_service_addr.All_nonerror_service_addrs.rg01.ref Resource group offline:rg01 process_resources Search on:Wed.Jun.30.16:14:37.EDT.2004.process_resources.rg01.ref  

示例 9 显示了一个示例 node_down_complete 事件。

示例 9 Node_down_complete 事件

:node_down_complete[352] exit 0 Jun 30 16:14:48 EVENT COMPLETED:node_down_complete p630n01 graceful HACMP Event Summary Event:node_down_complete p630n01 graceful Start time:Wed Jun 30 16:14:43 2004 End time:Wed Jun 30 16:14:48 2004 Action:Resource:Script Name: Resource group offline:rg01 process_resources Search on:Wed.Jun.30.16:14:45.EDT.2004.process_resources.rg01.ref  

应该尽可能避免使用 kill -9 命令来停止集群管理器守护进程。在这样的情况下,SRC 将检测到 clstrmgr 守护进程异常退出,并将调用 /usr/es/sbin/cluster/utilities/clexit.rc。这样会中止系统,并且可能破坏位于共享存储上的数据。其余节点将根据资源组策略启动接管。

如果遇到任何与集群服务停止相关的问题,或者希望全面了解集群停止进程,请参阅 HACMP for AIX 5L V5.1 Adminstration and Troubleshooting Guide, SC23-4862-02 中的第 7 章“Starting and Stopping Cluster Services”。

Graceful

当您指定了此参数时,节点拥有的资源组将被释放,但是不会由其他节点获取。

Graceful with takeover

当您指定了此参数时,该节点拥有的资源组将被释放,并根据资源组类型由其他节点获取。

Forced

当您指定了此参数时,集群服务将停止,但是资源组不会被释放。

注意:建议不要一次在多个节点上强制关闭集群服务。

若要更好地了解这些选项,请参阅 HACMP for AIX 5L V5.1 Adminstration and Troubleshooting Guide, SC23-4862-02 中的第 7 章“Starting and Stopping Cluster Services”。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/27879.html