尽管 HACMP 是一个功能强大的组件,如果没有正确的测试,在实现后也会成为一场灾难。在本文中,我们将详细介绍一些基本的测试过程。
验证和测试是可靠的配置的精髓,并且是成功实现的基础之一。大多数系统管理员都记得他们的上一个 HACMP 实现,其原因要么是该实现的压力极大,要么是因为一切都按预期顺利进行。
HACMP 集群的优劣由您对其所做的设计、实现和测试工作决定。
尽管 HACMP 是一个功能强大的组件,如果没有正确的测试,在实现后也会成为一场灾难。未经计划的接管、不完善的脚本、莫名中止的节点以及一般的停机时间都可能是未经测试的集群配置的副作用。尽量列出尽可能多的故障场景,创建测试计划,验证所有故障情况下的集群行为,然后仔细检查集群规划,并确保消除了任何单点故障。
在本章中,我们将详细介绍一些基本的测试过程。
务必记住,高可用性不仅包括 HACMP 软件,而且还包括适当的硬件、可靠的软件、具有详细文档记录的设计、高级的自定义、管理和变更管理。
设计和安装 HACMP 是一回事,让它按您的预期工作完全是另外一回事。只有一种方法可以确定 HACMP 是否按预期工作:测试、检验和验证。务必记住,一旦集群已经运行,生产环境的变更就更难实现(如果可能的话)。
测试和验证可能随所选择的集群解决方案而异;
然而,我们必须一再强调的是,测试可能是整个实现中最重要的组成部分,因为测试做得越多,结果就越好。
尽量模拟能够想象的每种事故;配置的优劣将由您对其所做的测试决定。
我们已不胜其烦地强调了我们认为对于检验和验证配置来说非常重要的一些要点;然而,由于每个配置都是不同的,应该将这些要点用作一般指导原则。
请考虑以下要点:
验证您有冗余的电源、排风机、控制器等等。 验证 sysplanar、适配器、磁盘等的微码级别是最新的。 验证所使用的每个网络接口与实际交换机端口所报告的速度匹配。 验证您有足够的软件许可证。有些软件许可证基于处理器 ID 和处理器数量。如果一个节点发生故障,另一个节点应该能够接管。