MC/ServiceGuard 使您可创建 HP 9000
系列 800 计算机的高可用性群集。高可用性计算机系统可在硬件或软件出现故障的情况下继续执行应用程序服务。高可用的系统可使用户免受因软件、系统处理单元
(SPU)、磁盘或局域网 (LAN) 部件故障而带来的损失。如果一个部件出现故障,冗余部件则会接管该部件的任务。MC/ServiceGuard
和其他高可用性子系统协调部件间的转移。
MC/ServiceGuard 群集是 HP 9000 系列
800 服务器(称作节点的主系统)的联网组合,这些服务器具有足够的软件和硬件冗余,单点故障不会给服务带来很大的破坏。应用程序服务(单个的
HP-UX 进程)组合在程序包中;如果单个的服务、节点、网络或其他资源出现故障,MC/ServiceGuard
则自动将程序包的控制权转移给群集中的另一节点,从而使服务在中断极短时间的情况下继续进行。
图 1-1 显示了典型的双节点 MC/ServiceGuard 群集。
图中的节点 1(任一 SPU 的节点)运行程序包 A,节点 2 运行程序包
B。每个程序包都有与其相关的一组独立磁盘,磁盘上存有程序包的应用程序需要的数据和数据的镜像副本。请注意,两个节点与两组镜像磁盘都有物理连接。不过,每次只有一个节点可访问给定磁盘组的数据。图中所示的节点
1 对上两个磁盘具有专有访问权(实线连接),节点 2 则不能访问这两个磁盘(虚线连接)。同样地,节点
2 对下两个磁盘具有专有访问权(实线连接),节点 1 则不能访问这两个磁盘(虚线连接)。
数据的镜像副本在磁盘故障时提供冗余。另外,总共有
4 条总线供连接到节点 1 和节点 2 的磁盘使用。这一配置可提供最大冗余和最佳
I/O 性能,因为每个程序包使用不同的总线。
请注意,网络硬件连有电缆,以在每个节点上提供冗余局域网接口。MC/ServiceGuard 使用
TCP/IP 网络服务实现群集中节点间的可靠通信,包括心跳消息的传输,以及每个正在运行节的点上对群集运行很重要的信号的传输。TCP/IP
服务也用于其他类型的节点间通信。(有关“心跳”的详细说明,请参见“了解
MC/ServiceGuard 软件”一章)。
故障切换 |
 |
一般情况下,完全运行的 MC/ServiceGuard 群集只监视群集组件运行是否正常,而程序包则在各节点上运行。MC/ServiceGuard
群集中运行的任何主机系统都称作活动节点。创建程序包时,将指定一个主节点和一个或多个代管节点。在某个节点或其网络通信出现故障时,MC/ServiceGuard
则将程序包的控制权转移给下一个可用代管节点,如图 1-2 中所示。
转移控制权后,只要代管节点继续运行,程序包通常会一直留在代管节点中。不过,如果愿意,也可配置程序包在主节点一恢复正常时即返回主节点。另外,还可在适当的时间将程序包控制权手动转移回主节点。
图 1-2 未显示群集的电源连接,但电源连接也很重要。为了除去群集中的所有单点故障,应提供防止节点、磁盘和磁盘镜像单点故障所需数目的单独电路。每个电路都应由不间断电源保护。有关详细信息,请参见第
4 章“规划和记录 HA 群集”中的“电源规划”一节。
MC/ServiceGuard 可与其他高可用性产品一起使用,如 MirrorDisk/UX
或 VERITAS Volume Manager,它们可提供磁盘冗余以减少磁盘子系统中的单点故障;Event
Monitoring Service(事件监视服务,EMS),使您可监视和检测不由 MC/ServiceGuard
直接处理的故障;磁盘阵列,使用各种 RAID 级别实现数据保护;HP 支持的不间断电源
(UPS),如 HP PowerTrust,它可减少由停电引起的故障。我们极力建议您在使用
MC/ServiceGuard 时也一起使用这些产品,以提供最高可用性。