HACMP 的基本概念可按如下方式进行分类:
集群拓扑包含基本集群成员节点、网络、通信接口、通信设备和通信适配器。
集群资源将要使其高度可用的实体(例如,文件系统、原始设备、服务 IP 标签和应用程序)。资源在资源组(resource group,RG)中分组在一起,HACMP 将资源组作为单个实体来保持其高度可用。
资源组可从单个节点使用,或在并发应用程序的情况下,可以同时从多个节点使用。
故障转移表示资源组响应活动节点上的故障而从该活动节点转移到另一个节点(备份节点)。
退回表示资源组在先前的节点变得可用时从备份节点转移到先前的节点。此转移通常是为了响应先前发生故障的节点的重新集成。
要理解 HACMP 的正确功能和用途,必须知道一些重要的术语:
集群 (Cluster)独立系统(节点)或 LPAR 的松散耦合的集合,组织到一个网络中以便共享资源和彼此通信。
HACMP 定义了操作系统之间的关系,其中当某个集群节点无法提供服务时,对等的集群节点将提供该节点所提供的服务。
在任何集群组件发生故障的情况下,这些单独的节点共同维持一个或多个应用程序的功能。
节点 (Node)运行 AIX 和 HACMP 的 IBM Eserver pSeries 计算机(或 LPAR),被定义为集群的一部分。每个节点都有一个资源集合(磁盘、
文件系统、IP 地址和应用程序),在节点发生故障的情况下,可以将该资源集合转移到集群中的另一个节点。
资源 (Resource)资源是集群配置的逻辑组件,可从一个节点移动到另一个节点。提供高度可用的应用程序或服务所必需的所有逻辑资源在资源组 (RG) 中分组在一起。
在节点发生故障的情况下,资源组中的组件一起从一个节点移动到另一个节点。集群可能具有多个资源组,从而允许高效地使用集群节点(从而实现 HACMP 中的“多处理”)。
接管 (Takeover)接管是指在集群内的节点之间转移资源的操作。
如果一个节点由于硬件问题或 AIX 崩溃而发生故障,其资源应用程序将移动到另一个节点。
客户端 (Client)客户端是能够通过局域网访问运行在集群节点上的应用程序的系统。客户端运行客户端应用程序,连接到运行应用程序的服务器(节点)。