| 臺灣-繁體中文 |
|
|
|
![]() |
HP Integrity Essentials 全域工作負載管理員使用指南: A.03.00.00 > 第 5 章. 其他的配置與管理作業自動重新啟動 SRD 中的 gWLM 受管理節點 (高可用性) |
|
每當受管理節點啟動時,該節點的 gWLM 代理程式便會試圖自動重新加入其 SRD 中的節點,以提供更高的可用性。下列為針對上述行為僅需執行的配置步驟:
當一次失去一個受管理節點或所有受管理節點皆失去時,此特性便能發揮最佳功效。
若將 /etc/rc.config.d/gwlmCtl 檔案中的 gwlmagent 設為 1,便會在受管理節點啟動時自動啟動 gWLM 代理程式 (gwlmagent)。代理程式接著檢查 /etc/opt/gwlm/deployed.config 檔案,以決定其 CMS。接下來,它會試圖與 CMS 聯繫,讓 CMS 重新部署其 SRD 視界。若無法聯繫 CMS,只要所有的節點均同意,便會部署 deployed.config 檔案中的 SRD。 一般而言,若 SRD 因節點關閉或網路通訊問題受到干擾時,gWLM 便會試圖重組 SRD。gWLM 會對 SRD 中的節點維持叢集的概念。叢集中,只有一個是主節點,其餘皆為非主節點。若主節點與其餘的 SRD 失去聯繫,其餘的 SRD 在一致同意新主節點的情況下,仍可在無原有主節點的情況下以部份叢集 (partial cluster) 繼續運作。若非主節點與其餘的 SRD 失去聯繫,剩下的部份叢集仍可在沒有這個失去的節點的情況下繼續運作。主節點僅是忽略這個失去的節點,直到再次可使用它為止。
您可以配置下列與此自動重新啟動特性相關的 SIM 事件:
若需啟用和檢視這些事件的相關資訊,請參閱 gWLM 的「Configure Events」功能表。 您可以利用 SIM 左側窗格的 Event List 項目檢視這些事件。 下列各節說明處理這些事件的方式。 若出現此事件:
若有包含 n 個節點的 SRD,而出現 n - 1 個「SRD Communication Issue」事件 但是 在第一次出現「SRD Communication Issue」事件後五分鐘內 (假設配置時間間隔為 15 秒),沒有出現「SRD Reformed with Partial Set of Nodes」事件。 您可能需要重新啟動受影響的 SRD 中每一個受管理節點上的 gwlmagent: # /opt/gwlm/bin/gwlmagent --restart gWLM 若無法重組 SRD,如下所述地手動清理 SRD。 下文討論的命令是清理 SRD 的進階命令。使用 gwlm undeploy 命令是典型自管理移除主機的建議方法。 自 A.02.50.00.x 版代理程式開始,您可以利用下列命令手動清理 SRD: # gwlm reset --host=主機 其中,主機指定欲清理具 SRD 的主機。 若上述命令無作用,請遵循下節中的程序進行。 下列程序清理 SRD,無關 SRD 中的代理程式版本為何:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||