跳到内容 中国
HP.com 主页 产品与服务 支持及驱动程序 解决方案 如何购买
» 联系惠普
更多选项
HP.com 主页
HP Serviceguard Extension for Faster Failover A.01.00 发行说明 > 第 1 章 Serviceguard Extension for Faster Failover A.01.00 发行说明

本版本包含的内容

» 

技术文档资料

完整的 PDF 手册
» 反馈
内容从此开始:

 » 目录

A.01.00 版是 Serviceguard Extension for Faster Failover (SGeFF) 产品的第 1 个发行版。该产品支持更快的群集重组。由于群集能够更快重组,因此减少了总的故障切换时间。要利用快速故障切换的功能,群集必须安装 Faster Failover 产品,并满足某些配置要求(如下所述)。

Faster Failover 特征如下:

  • Serviceguard 群集配置文件中添加了一个选项。当使用 cmquerycl 命令打开群集配置文件时,如果安装了 Serviceguard Extension for Faster Failover,则其中会出现一个新选项 FAILOVER_OPTIMIZATION。

  • 如果将故障切换优化选项设置为 TWO_NODE,Serviceguard 就会优化群集重组功能,从而减少程序包在群集中不可用的总时间量。

为获得支持,Faster Failover 群集必须满足几个配置要求。下面列出了“对 Faster Failover 群集的要求”。

对 Faster Failover 群集的要求

为支持更快的故障切换,需要以下配置:

  • 群集中必须有两个群集节点。可以在一个节点上配置群集,但只有当第二个节点加入到群集中,才能发生故障切换。

  • 群集必须安装 Serviceguard A.11.16 或更高版本。

  • 群集必须至少配置两条心跳线。使用一组聚合端口的单个心跳线被视为一条心跳线。

    在 Faster Failover 群集中,不能使用串行 (RS232) 链路连接心跳线子网。

    注释:Faster Failover 群集不支持 CVM 卷组,因为此类卷组不支持多个心跳线网络。
  • 必须配置一个 Quorum Server 作为群集锁。Quorum Server 安装在该群集以外的节点上。检查网络:这两个群集节点必须都能够访问 Quorum Server 节点。

规划和配置 Faster Failover 群集

对于 Faster Failover 群集,需要满足下列要求。请仔细检查以确保在使用 Faster Failover 群集前可满足这些要求。输入 Faster Failover 群集的配置信息后,可发出 cmcheckconf 命令来检查 syslog 文件中有关未满足的要求的消息­­。

  • 首先安装启用软件:

    1. 必须在群集中的每个节点上安装 Serviceguard 11.16 或更高版本。

    2. 如果要使用 Oracle RAC,请接着安装 Serviceguard Extension for RAC 11.16 或更高版本。

    3. 然后,在群集中的每个节点上安装 Serviceguard Extension for Faster Failover。可以先安装和配置一个节点。但只有完成在另一节点上的安装和配置后,故障切换才起作用。

    可以从以下位置查看和打印 Serviceguard 及 Serviceguard Extension for RAC 的发行说明:http://docs.hp.com/zh_cn/index.html

  • 其次配置 Faster Failover 群集。如果要使用远程节点来配置、修改或查看 Faster Failover 群集的信息,此远程节点也必须安装有 Serviceguard 11.16 或 Serviceguard Extension for RAC 11.16(或者更高版本)。

    如果将 Serviceguard Manager 安装在管理工作站上,可选择一个安装有 Faster Failover 的未用节点,然后从“操作”菜单中选择“配置”(Serviceguard Manager 的发行说明发布在 http://docs.hp.com/zh_cn/index.html 网站上)。

    如果正在使用 Serviceguard 命令行,可发出 cmquerycl -C 命令来打开群集配置文件进行编辑。如果已经配置了群集,则会打开配置文件以供修改。如果尚未配置群集,则会创建一个模板以供编辑。该命令的示例如下:

    # cmquerycl -v -C /etc/cmcluster/cluster1.config -n ftsys9 -n ftsys10 -q qhost

    此示例会将群集 cluster1 的群集配置文件放在 /etc/cmcluster/(缺省目录)中。可以使用任何文本编辑器编辑此 ASCII 文件中的配置。此示例中使用的命令行选项会预先设置节点 (-n) 和 Quorum Server (-q) 的值,如下所述。

  • 此群集必须有两个群集节点。可以在一个节点上正常配置群集,但只有当第二个节点加入到群集中,才能发生故障切换。在命令示例中,-n 选项用来指定节点名称。

  • 在群集配置文件中,将 FAILOVER_OPTIMIZATION 参数设置为 TWO_NODE 即可启用 Faster Failover(缺省值为 NONE)。

  • 为此群集至少配置两条心跳线。使用一组聚合端口的单个心跳线被视为一条心跳线。

    在 Faster Failover 群集中,不能使用串行 (RS232) 链路连接心跳线子网。

    注释:Faster Failover 群集不支持 CVM 卷组,因为此类卷组不支持多个心跳线网络。
  • 必须配置一个 Quorum Server 作为群集锁。Quorum Server 安装在该群集以外的节点上。在上面的命令示例中,-q 选项用来指定 Quorum Server qhost

    Quorum Server 是一个免费产品,可从 Serviceguard 安装组件 CD 中获得。也可免费从 http://software.hp.com 网站下载。有关详细信息,请参阅安装组件 CD 上或 http://docs.hp.com/zh_cn/index.html 中的《Quorum Server 发行说明》。

  • 设置 NODE_TIMEOUTHEARTBEAT_INTERVALQS_TIMEOUT_EXTENSION 参数前,请阅读下面一节“Faster Failover 中的注意事项”。

  • 输入配置信息后,可使用 cmcheckconf 命令来验证此信息。如果在启用 Faster Failover(将 FAILOVER_OPTIMIZATION 设置为 TWO_NODE)后配置不符合要求,则会显示一条描述性错误消息。

  • 要完成群集配置,可使用 cmapplyconf 命令。当群集正在运行时,不能修改 FAILOVER_OPTIMIZATION 参数。要修改此参数,必须先暂停该群集。

有关配置群集的一般信息,请参阅 http://docs.hp.com/zh_cn/index.html 上的《管理 Serviceguard》手册。

有关 Serviceguard 命令及其参数的详细信息,请参阅联机帮助页 cmqueryclcmcheckconfcmapplyconf。有关使用 Serviceguard Manager 配置群集的信息,请参阅联机帮助。

Faster Failover 中的注意事项

对于希望减少故障切换时间的群集来说,Faster Failover 是一个很好的解决办法。在确定该解决办法是否适合您的具体环境时,需要考虑下面几点注意事项。

Serviceguard Extension for RAC (SGeRAC) 群集的环境尤其适合于 Faster Failover。在 SGeRAC 环境中,当 Oracle RAC 得到某个群集成员发生变化的通知时,Oracle RAC 就会开始重新配置。通过 Faster Failover,Oracle RAC 会迅速得到任何群集成员发生变化的通知,从而能够迅速开始重新配置。

Faster Failover 可安装在带有一个 Quorum Server 以及多个心跳线的双节点群集上。设想这样一个环境,NODE_TIMEOUT 设置为 1.6 秒,HEARTBEAT_INTERVAL 设置为 0.8 秒,QS_TIMEOUT_EXTENSION 设置为 0。如果未安装 Faster Failover,群集重组约需 23 秒,而如果安装了 Faster Failover,则仅需 5 秒。

但是,作为安装中很重要的一部分,将 NODE_TIMEOUT 设置为 5 到 8 秒比设置为上述示例中的 1.6 秒更合适。如果使用 5 到 8 秒的节点超时 (NODE_TIMEOUT) 重新计算,则如果未安装 Faster Failover,群集重组约需 70 到 112 秒,而如果安装了 Faster Failover,则仅需 15 到 24 秒。

一旦增加 QS_TIMEOUT_EXTENSION 的值,该值就会直接添加到故障切换时间中。

SgeFF 比较适合于应用程序故障切换时间短的群集。请注意,Faster Failover 仅减少群集重组时间,而不会减少应用程序故障切换时间。如果重组后应用程序需要 30 分钟重新启动,则在群集故障切换时间上节省几秒钟对用户来说不会有很大差别。

Faster Failover 不允许群集拥有两个以上的节点。请仔细估算日后的群集容量。如果日后要在群集中添加更多节点,则必须禁用 Faster Failover。而且,要在群集配置中禁用 Faster Failover,必须暂停整个群集。

Faster Failover 需要一个 Quorum Server 群集锁。Quorum Server 是一个免费产品。订购 Serviceguard 后,可以从 Serviceguard 安装组件 CD 中免费获得 Quorum Server 软件。也可免费从网站 http://software.hp.com 下载。

请确保 Quorum Server 通过可靠网络(如不繁忙的心跳线网络)连接到群集。如果某个节点尝试获得 Quorum Server 锁,但无法及时访问它,则整个群集可能会停止运行。

可以考虑将 Quorum Server 本身配置为所对应的 SGeFF 群集以外的某个群集上的高可用性程序包。这有助于确保群集的高可用性,并且不难实现。有关说明,请参阅安装组件 CD 上或 http://docs.hp.com/zh_cn/index.html 中的《Quorum Server 发行说明》。

风险

短时间的故障切换有一定的风险。如果是暂时性问题,您可能允许其占用一段较短的时间来进行恢复。请考虑您希望群集占用多长时间来确认可能出现(如果不确定)的故障。

SGeFF 不应安装在非常繁忙的系统中,因为这种系统中的网络或 CPU 活动会很频繁,或者出现较大的峰值。这可能会导致出现暂时性问题,并发生心跳线延迟。

在 SGeFF 群集中设置和测试 NODE_TIMEOUT 时必须小心。

节点超时不应太短,设置得太短会使节点发生暂时性问题或临时中断。请确定希望 Serviceguard 在超时并执行操作之前等待这些问题恢复的时间。

节点超时不应太短,设置得太短会使正常节点发出的延迟心跳线造成群集开始重组。这样,节点可能会不必要地脱离群集。另一种情况,该节点可能会及时恢复并重新加入群集;此时可以看到,虽然群集已经重组,但其成员关系仍与重组前的状态一致。

由于 Faster Failover 群集完成重组过程极其迅速,因此很有可能正常节点因暂时性问题而超时并脱离群集。

设想有两个相同的双节点群集,其 Faster Failover 配置有效。QS_TIMEOUT_EXTENSION 设置为 0,NODE_TIMEOUT 设置为 2 秒。一个群集安装有标准的 Serviceguard,另一个则启用了 SGeFF。如果出现一个暂时性问题并持续 8 秒,设想一下会发生什么情况。

  • 在标准 Serviceguard 中,重组大约需要 28 秒。完成重组前,暂时性问题会及时恢复,以使此节点能够继续保持原样并重新加入群集。

  • 如果启用了 SGeFF,重组会在 6 秒内完成,远远少于问题恢复所需的时间。群集将在没有该节点的情况下进行重组。此节点将重新引导。

更改 NODE_TIMEOUT 的值时请小心。它对 Faster Failover 群集的影响非常大。更改 SGeFF 群集的超时值时,请以上述示例中的相同群集为例考虑可能发生的情况。

  • 如果使用标准的 Serviceguard 和 2 秒的超时值,群集重组大约需要 28 秒。

  • 如果启用了 SGeFF,并设置 4 秒的超时值,则群集重组大约需要 12 秒。

也就是说,如果 SGeFF 群集的超时值增加到原来的两倍,其重组的时间就会减少一半以上

本版本提供的文档

随 Serviceguard Extension for Faster Failover A.01.00 提供的手册包括:

  • Serviceguard Extension for Faster Failover A.01.00 发行说明》(HP 生产部件号:T2389-90010),即本文档。

    此文档可从 http://docs.hp.com/zh_cn/index.html 网站获得。请查看所使用的软件附带的 README 文件。

  • Optimizing Failover Time in a Serviceguard Environment》,也发布在 http://docs.hp.com/hpux/ha 网站上。

其他信息

与 Serviceguard 有关的的用户指南、发行说明和白皮书的最新版本(包括本文档的任何更新信息)都可以从 http://docs.hp.com/zh_cn/index.html 获得。

  • 管理 Serviceguard》(适用于 A.11.17.01 版),
    HP 生产部件号:B3936-90108

  • HP Serviceguard A.11.17 发行说明》(适用于 HP-UX 11i v3),
    HP 生产部件号:B8325-90099

  • Serviceguard Quorum Server A.02.00 发行说明》(第 5 版),
    HP 生产部件号:B8467-90039

可从 Hewlett-Packard IT 资源中心网页上获得支持信息,其中包括有关修补软件和已知问题的最新信息:

http://itrc.hp.com(美国和亚太地区)
http://europe.itrc.hp.com(欧洲)

单击“Search Technical Knowledge Base”。虽然任何人都可以访问此站点,但只有签署有效技术支持合同的客户才能登录并搜索详细的技术信息。

要获得有关推荐修补软件、产品支持及最新支持的硬件的最新消息,请订阅 ITRC(IT 资源中心)上的“High Availability Program Tips and Issues Digest”。

打印版本
保密声明 使用本网站表示您同意其使用条件
© Hewlett-Packard Development Company, L.P.