| 中国 |
|
|
|
![]() |
HP Integrity Essentials Global Workload Manager A.03.00.00 用户指南 > 第 5 章 其他配置和管理任务自动重新启动 SRD 中的 gWLM 受管节点(高可用性) |
|
每当受管节点引导时,该节点的 gWLM 代理就会尝试在其 SRD 中自动重新加入该节点,从而提供了高可用性。要实现此行为,只需要执行如下配置步骤:
当丢失一个受管节点或所有受管节点都丢失时该功能将发挥最佳作用。
当受管节点引导时,如果在 /etc/rc.config.d/gwlmCtl 文件中将 GWLM_AGENT_START 设置为 1,则 gWLM 代理 (gwlmagent) 会自动启动。然后该代理将检查 /etc/opt/gwlm/deployed.config 文件来确定其 CMS。随后,它会尝试与 CMS 联系以使 CMS 重新部署其 SRD 视图。如果无法联系 CMS,则只要所有节点接受,将部署 deployed.config 文件中的 SRD。 一般来说,当 SRD 由于节点关闭或网络通信问题而受到破坏时,gWLM 会尝试重组 SRD。gWLM 会为 SRD 中的节点保持群集的结构。在群集中,只有一个节点是主节点,其他的节点都是非主节点。如果主节点与 SRD 的其余节点失去联系,SRD 的其余节点可以在没有主节点的情况下,通过一致接受一个新的主节点而作为部分群集继续工作。如果非主节点与 SRD 的其余节点失去通信,则生成的部分群集会在不存在该丢失的节点的情况下继续操作。主节点仅忽略丢失的节点,直到它重新变为可用。
可以针对该自动重新启动功能配置下列 SIM 事件:
有关启用和查看这些事件的信息,请参考 gWLM 的 Configure Events 菜单。 然后可以通过使用 SIM 左侧窗格中的 Event Lists 项查看这些事件。 下面几节说明如何处理其中一些事件。 如果出现该事件:
如果有一个包含 n 个节点的 SRD,且收到 n - 1 个“SRD 通信问题”事件 但 在收到第一个“SRD 通信问题”事件的 5 分钟(假设分配时间间隔为 15 秒)内没有收到“使用部分节点集重组 SRD”事件 可能需要在受影响的 SRD 中的每个受管节点上重新启动 gwlmagent: # /opt/gwlm/bin/gwlmagent --restart 如果 gWLM 无法重组 SRD,可以手动清除 SRD,如下所述。 下述命令是一个用于清除 SRD 的高级命令。通常,要从管理中删除主机,推荐使用 gwlm undeploy 命令。 从 A.02.50.00.x 代理开始,可以使用以下命令手动清除 SRD: # gwlm reset --host=主机 其中主机指定含有要清除的 SRD 的主机。 如果上述命令不起作用,请按照下一节介绍的步骤操作。 无论 SRD 中的代理是什么版本,通过下列步骤都可以清除 SRD:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||