| 中国 |
|
|
|
![]() |
HP Global Workload Manager 4.0 用户指南 > 第 5 章 其他配置和管理任务自动重新启动 SRD 中的 gWLM 受管节点(高可用性) |
|
每当受管节点引导时,该节点的 gWLM 代理就会尝试在其 SRD 中自动重新加入该节点,从而提供了高可用性。要实现此行为,只需要执行如下配置步骤:
当丢失一个受管节点或所有受管节点都丢失时该功能将发挥最佳作用。
当受管节点引导时,如果在 /etc/rc.config.d/gwlmCtl 文件中将 GWLM_AGENT_START 设置为 1,则 gWLM 代理 (gwlmagent) 会自动启动。然后,该代理将检查 /etc/opt/gwlm/deployed.config 文件来确定其 CMS。随后,它会尝试与 CMS 联系以使 CMS 重新部署其 SRD 视图。如果无法联系 CMS,则只要所有节点接受,就会部署 deployed.config 文件中的 SRD。 一般来说,当 SRD 由于节点关闭、CMS 关闭或网络通信问题而被损坏时,gWLM 会尝试重组 SRD。gWLM 会为 SRD 中的节点保持一个群集结构。在群集中,只有一个节点是主节点,其他的节点都是非主节点。如果主节点与 SRD 的其余节点失去联系,SRD 的其余节点可以在没有主节点的情况下,通过一致接受一个新的主节点而作为部分群集继续工作。如果非主节点与 SRD 的其余节点失去通信,则生成的部分群集会在不存在该丢失的节点的情况下继续操作。主节点仅忽略丢失的节点,直到它重新变为可用。 您可以使用 gwlmstatus 命令监视可用性。该命令可确定是否有任何主机无法重新加入节点的 SRD,以及 SRD 中的主机是否无响应。有关详细信息,请参阅 gwlmstatus(1M)。
可以针对此自动重启特性配置下列 HP SIM 事件:
有关启用和查看这些事件的信息,请参考 gWLM 的“Events”菜单。 然后,可以通过 HP SIM 左侧窗格中的 Event Lists 项查看这些事件。 下面几节说明如何处理其中一些事件。 如果出现“启动时节点无法重新加入 SRD”事件,请执行下列操作:
如果有一个 SRD 包含 n 个节点,并且在发生第一个“SRD Communication Issue”事件后的 5 分钟内发生 n - 1 个“SRD Communication Issue”事件,但未发生“SRD Reformed with Partial Set of Nodes”事件(假定分配时间间隔为 15 分钟),则可能需要在受影响的 SRD 中的每个受管节点上重新启动 gwlmagent: # /opt/gwlm/bin/gwlmagent --restart 如果 gWLM 无法重组 SRD,可以手动清除 SRD,如下一节所述。 下述命令是一个用于清除 SRD 的高级命令。通常,要取消管理某个主机,建议使用 gwlm?undeploy 命令。 从 A.02.50.00.04 代理开始,可以使用以下命令手动清除 SRD: # gwlm reset --host=主机 其中主机指定含有要清除的 SRD 的主机。 如果此命令不起作用,请按照下一节介绍的步骤操作。 无论 SRD 中的代理是什么版本,通过本节中的步骤都可以清除 SRD。 在安装过程中,会将 gwlm 命令添加到如下所述的路径中。在 HP-UX 系统上,该命令位于 /opt/gwlm/bin/ 中。在 Microsoft Windows 系统中,该命令在缺省情况下位于 C:\Program Files\HP\Virtual Server Environment\bin\gwlm\ 中。但是,您可以在安装时选择其他路径。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||