为高可用性而配置的系统是以如下方式配置的硬件和软件组件的组合:即确保在发生故障时,能够使用最短的可接受停机时间实现自动化的恢复。
在此类系统中,相关软件将检测环境中的问题,然后将应用程序传输到另一台计算机,从而接管原始计算机(节点)的身份。
因而,消除环境中的所有单点故障 (SPOF) 是非常重要的。例如,如果计算机只有一个网络连接,则应该在同一个节点中提供第二个网络接口,以便在提供服务的主适配器发生故障时接管工作。
另一个重要问题是镜像数据,并将数据放在可从集群中的任何一台计算机访问的共享磁盘区域,从而保护数据。
高可用性集群多处理(High Availability Cluster Multi-Processing,HACMP)软件提供了用于在高度可用的系统中集成应用程序的框架和一组工具。
要在 HACMP 集群中集成的应用程序需要相当多的自定义,此自定义不是在应用程序级别进行,而是在 HACMP 和 AIX 平台级别进行。
HACMP 是一个灵活的平台,允许运行在 AIX 平台上的通用应用程序实现集成,从而以合理的成本提供高度可用的系统。
与其他解决方案相比较,高可用性 (HA) 解决方案可以提供许多优点。表 2 描述了一些 HA 解决方案及其特征。
表 2 HA 解决方案的类型
解决方案 独立系统 增强的独立系统 高可用性集群 容错系统
停机时间 两天 两小时 视情况而定(通常三分钟) 永不停机
数据可用性 上次的完全备份 上一个事务 上一个事务 无数据损失
高可用性解决方案提供了以下优点:
标准的组件 可与现有的硬件一起使用 适用于几乎任何应用程序 可使用广泛的磁盘和网络类型 以合理成本实现卓越的可用性针对 IBM Eserver pSeries 的 IBM 高可用性解决方案提供了一些独特的优点。此类优点包括:
经证实的解决方案(超过 14 年的产品开发历史) 灵活性(在独立 AIX 系统上运行的几乎任何应用程序都可以使用 HACMP 来保护) 使用“现成的”硬件组件 经证实的客户支持承诺提供高可用性解决方案的注意事项包括:
全面的设计和详细的规划 消除单点故障 选择适当的硬件 正确的实现(不要走“捷径”) 训练有素的系统管理实践 有文档记录的操作过程 详尽的测试