HACMP 认证学习系列,第 1 部分:入门(3)

什么对象需要受到保护?最终,关键环境中的任何 IT 解决方案的目标都是提供连续的服务和数据保护。

高可用性只是实现连续操作目标的一个构件。高可用性基于硬件、软件(操作系统及其组件)、应用程序和网络组件的可用性。

若要实现高可用性解决方案,您需要:

冗余服务器 冗余网络 冗余网络适配器 监视 故障检测 故障诊断 自动化的故障转移 自动化的重新集成

HACMP 的主要目标是消除单点故障 (SPOF)(请参见第 7 页上的表 1)。

表 1 单点故障

集群对象 消除单点故障的方法
节点(服务器)   多个节点  
电源   多个电路和/或电源  
网络适配器   冗余网络适配器  
网络   用于连接节点的多个网络  
TCP/IP 子系统   非 IP 网络以便为 TCP/IP 提供后备  
磁盘适配器   冗余磁盘适配器  
磁盘   冗余硬件和磁盘镜像或 RAID 技术  
应用程序   配置应用程序监视和备份节点,以获取应用程序引擎和数据  

表 1 中的“集群对象”列中列出的每个项目是一个物理或逻辑组件,如果该组件发生故障,则会导致应用程序无法为客户端提供服务。

高可用性与容错的对比

可以将用于硬件和软件故障检测及处理的系统定义为两个组:

容错系统 高可用性系统

容错系统

提供容错功能的系统旨在几乎无中断地操作,而不管可能发生的故障如何(也许由于自然灾害导致的完全站点故障除外)。在此类系统中,至少为所有的软件或硬件组件配置了重复组件。

因而,CPU、内存和磁盘具有特殊的设计,即使在一个子组件发生故障时也可以提供连续的服务。

此类系统非常昂贵,并且极其专门化。实现容错解决方案需要大量的精力和所有系统组件的高度自定义。

在不能接受任何停机时间的场合(生命保障等等),容错设备和解决方案是必需的。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/27876.html