| 中国 |
|
|
|
![]() |
HP Serviceguard Extension for Faster Failover A.01.00 发行说明 > 第 1 章 Serviceguard Extension for Faster Failover A.01.00 发行说明本版本包含的内容 |
|
A.01.00 版是 Serviceguard Extension for Faster Failover (SGeFF) 产品的第 1 个发行版。该产品支持更快的群集重组。由于群集能够更快重组,因此减少了总的故障切换时间。要利用快速故障切换的功能,群集必须安装 Faster Failover 产品,并满足某些配置要求(如下所述)。 Faster Failover 特征如下:
为获得支持,Faster Failover 群集必须满足几个配置要求。下面列出了“对 Faster Failover 群集的要求”。 为支持更快的故障切换,需要以下配置:
对于 Faster Failover 群集,需要满足下列要求。请仔细检查以确保在使用 Faster Failover 群集前可满足这些要求。输入 Faster Failover 群集的配置信息后,可发出 cmcheckconf 命令来检查 syslog 文件中有关未满足的要求的消息。
有关配置群集的一般信息,请参阅 http://docs.hp.com/zh_cn/index.html 上的《管理 Serviceguard》手册。 有关 Serviceguard 命令及其参数的详细信息,请参阅联机帮助页 cmquerycl、cmcheckconf 和 cmapplyconf。有关使用 Serviceguard Manager 配置群集的信息,请参阅联机帮助。 对于希望减少故障切换时间的群集来说,Faster Failover 是一个很好的解决办法。在确定该解决办法是否适合您的具体环境时,需要考虑下面几点注意事项。 Serviceguard Extension for RAC (SGeRAC) 群集的环境尤其适合于 Faster Failover。在 SGeRAC 环境中,当 Oracle RAC 得到某个群集成员发生变化的通知时,Oracle RAC 就会开始重新配置。通过 Faster Failover,Oracle RAC 会迅速得到任何群集成员发生变化的通知,从而能够迅速开始重新配置。 Faster Failover 可安装在带有一个 Quorum Server 以及多个心跳线的双节点群集上。设想这样一个环境,NODE_TIMEOUT 设置为 1.6 秒,HEARTBEAT_INTERVAL 设置为 0.8 秒,QS_TIMEOUT_EXTENSION 设置为 0。如果未安装 Faster Failover,群集重组约需 23 秒,而如果安装了 Faster Failover,则仅需 5 秒。 但是,作为安装中很重要的一部分,将 NODE_TIMEOUT 设置为 5 到 8 秒比设置为上述示例中的 1.6 秒更合适。如果使用 5 到 8 秒的节点超时 (NODE_TIMEOUT) 重新计算,则如果未安装 Faster Failover,群集重组约需 70 到 112 秒,而如果安装了 Faster Failover,则仅需 15 到 24 秒。 一旦增加 QS_TIMEOUT_EXTENSION 的值,该值就会直接添加到故障切换时间中。 SgeFF 比较适合于应用程序故障切换时间短的群集。请注意,Faster Failover 仅减少群集重组时间,而不会减少应用程序故障切换时间。如果重组后应用程序需要 30 分钟重新启动,则在群集故障切换时间上节省几秒钟对用户来说不会有很大差别。 Faster Failover 不允许群集拥有两个以上的节点。请仔细估算日后的群集容量。如果日后要在群集中添加更多节点,则必须禁用 Faster Failover。而且,要在群集配置中禁用 Faster Failover,必须暂停整个群集。 Faster Failover 需要一个 Quorum Server 群集锁。Quorum Server 是一个免费产品。订购 Serviceguard 后,可以从 Serviceguard 安装组件 CD 中免费获得 Quorum Server 软件。也可免费从网站 http://software.hp.com 下载。 请确保 Quorum Server 通过可靠网络(如不繁忙的心跳线网络)连接到群集。如果某个节点尝试获得 Quorum Server 锁,但无法及时访问它,则整个群集可能会停止运行。 可以考虑将 Quorum Server 本身配置为所对应的 SGeFF 群集以外的某个群集上的高可用性程序包。这有助于确保群集的高可用性,并且不难实现。有关说明,请参阅安装组件 CD 上或 http://docs.hp.com/zh_cn/index.html 中的《Quorum Server 发行说明》。 短时间的故障切换有一定的风险。如果是暂时性问题,您可能允许其占用一段较短的时间来进行恢复。请考虑您希望群集占用多长时间来确认可能出现(如果不确定)的故障。 SGeFF 不应安装在非常繁忙的系统中,因为这种系统中的网络或 CPU 活动会很频繁,或者出现较大的峰值。这可能会导致出现暂时性问题,并发生心跳线延迟。 在 SGeFF 群集中设置和测试 NODE_TIMEOUT 时必须小心。 节点超时不应太短,设置得太短会使节点发生暂时性问题或临时中断。请确定希望 Serviceguard 在超时并执行操作之前等待这些问题恢复的时间。 节点超时不应太短,设置得太短会使正常节点发出的延迟心跳线造成群集开始重组。这样,节点可能会不必要地脱离群集。另一种情况,该节点可能会及时恢复并重新加入群集;此时可以看到,虽然群集已经重组,但其成员关系仍与重组前的状态一致。 由于 Faster Failover 群集完成重组过程极其迅速,因此很有可能正常节点因暂时性问题而超时并脱离群集。 设想有两个相同的双节点群集,其 Faster Failover 配置有效。QS_TIMEOUT_EXTENSION 设置为 0,NODE_TIMEOUT 设置为 2 秒。一个群集安装有标准的 Serviceguard,另一个则启用了 SGeFF。如果出现一个暂时性问题并持续 8 秒,设想一下会发生什么情况。
更改 NODE_TIMEOUT 的值时请小心。它对 Faster Failover 群集的影响非常大。更改 SGeFF 群集的超时值时,请以上述示例中的相同群集为例考虑可能发生的情况。
也就是说,如果 SGeFF 群集的超时值增加到原来的两倍,其重组的时间就会减少一半以上。 随 Serviceguard Extension for Faster Failover A.01.00 提供的手册包括:
与 Serviceguard 有关的的用户指南、发行说明和白皮书的最新版本(包括本文档的任何更新信息)都可以从 http://docs.hp.com/zh_cn/index.html 获得。
可从 Hewlett-Packard IT 资源中心网页上获得支持信息,其中包括有关修补软件和已知问题的最新信息: http://itrc.hp.com(美国和亚太地区) 单击“Search Technical Knowledge Base”。虽然任何人都可以访问此站点,但只有签署有效技术支持合同的客户才能登录并搜索详细的技术信息。 要获得有关推荐修补软件、产品支持及最新支持的硬件的最新消息,请订阅 ITRC(IT 资源中心)上的“High Availability Program Tips and Issues Digest”。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||