HACMP 认证学习系列,第 4 部分:集群的验证和测(2)

请考虑以下要点:

验证操作系统,并确保您已安装操作系统或应用程序所需的最新 PTF。 验证用户数量、每用户允许的最大进程数量、最大文件数量、单个文件的最大大小、堆栈大小等等。 验证 High Water Mark 和 Low Water Mark。在开始测试时,您可以分别为这两个属性分配值 33 和 24。最佳设置取决于系统配置、应用程序需求、I/O 操作量等等。您将必须监视系统性能一段时间,然后相应地调整这些参数 Syncd frequency.缺省值是 60。应该将其更改为 10,并开始监视集群性能,然后尝试确定能达到满意集群性能的最小值。 验证您有足够的分页空间。 验证转存(Dump)设备已正确设置。 对于频繁使用的文件系统,可能需要单独的 jfslog。确保其名称对所有逻辑卷、文件系统和 jfslog 来说是唯一的。如果对 jfslog 使用系统自动命名,您应该小心。 验证 /etc/filesystem 中的每个节 (stanza ) 已正确定义。 验证 /、/var 和 /tmp 中有足够的空间。 验证 /etc/services 文件。 确保时钟设置在所有节点上完全相同(日期、时区和 NTP 设置——如果使用的话)。 如果使用 DNS,请确保正确定义 DNS 服务器,并拥有在 DNS 变得可用时的退回计划。

集群环境

请考虑以下要点:

验证 PVID 在所有节点上保持一致。 验证每个卷组的 quorum 和 auto-varyon 参数已正确设置。 确保名称对整个集群中的所有逻辑卷、文件系统和 jfslog 来说是唯一的。如果对 jfslog 使用系统自动命名,您应该小心。 验证所有本地文件系统已装入。 验证应用程序所有者的 User ID 和 Group ID 在所有节点上完全相同。 确保应用程序使用的变量和用户配置文件在所有集群节点上保持一致。 验证 crontab 以及您是否拥有与某个资源组或应用程序相关并且需要与该资源组或应用程序一起进行故障转移的脚本。有关更多信息,请参阅 HACMP for AIX 5L V5.1 Adminstration and Troubleshooting Guide, SC23-4862-02。 验证您的应用程序仅由 HACMP 启动。对 /etc/inittab 的检查始终是有用的。 测试您的应用程序启动/停止和监视脚本(用于自定义监视器),并确保它们能够在无人参与的情况下运行并提供有用的日志记录信息。 对每个资源组执行手动接管,并记下有关 CPU 和磁盘使用、接管时间等的任何恰当信息。

在自定义应用程序监视和资源组行为时可以进一步使用此信息。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/27879.html