什么对象需要受到保护?最终,关键环境中的任何 IT 解决方案的目标都是提供连续的服务和数据保护。
高可用性只是实现连续操作目标的一个构件。高可用性基于硬件、软件(操作系统及其组件)、应用程序和网络组件的可用性。
若要实现高可用性解决方案,您需要:
冗余服务器 冗余网络 冗余网络适配器 监视 故障检测 故障诊断 自动化的故障转移 自动化的重新集成HACMP 的主要目标是消除单点故障 (SPOF)(请参见第 7 页上的表 1)。
表 1 单点故障
集群对象 消除单点故障的方法节点(服务器) 多个节点
电源 多个电路和/或电源
网络适配器 冗余网络适配器
网络 用于连接节点的多个网络
TCP/IP 子系统 非 IP 网络以便为 TCP/IP 提供后备
磁盘适配器 冗余磁盘适配器
磁盘 冗余硬件和磁盘镜像或 RAID 技术
应用程序 配置应用程序监视和备份节点,以获取应用程序引擎和数据
表 1 中的“集群对象”列中列出的每个项目是一个物理或逻辑组件,如果该组件发生故障,则会导致应用程序无法为客户端提供服务。
可以将用于硬件和软件故障检测及处理的系统定义为两个组:
容错系统 高可用性系统容错系统
提供容错功能的系统旨在几乎无中断地操作,而不管可能发生的故障如何(也许由于自然灾害导致的完全站点故障除外)。在此类系统中,至少为所有的软件或硬件组件配置了重复组件。
因而,CPU、内存和磁盘具有特殊的设计,即使在一个子组件发生故障时也可以提供连续的服务。
此类系统非常昂贵,并且极其专门化。实现容错解决方案需要大量的精力和所有系统组件的高度自定义。
在不能接受任何停机时间的场合(生命保障等等),容错设备和解决方案是必需的。