| 臺灣-繁體中文 |
|
|
|
![]() |
HP 全域工作負載管理員 4.0 版使用指南 > 第 5 章. 其他的配置與管理作業自動重新啟動 SRD 中的 gWLM 受管理節點 (高可用性) |
|
每當受管理節點開機時,該節點的 gWLM 代理程式便會試圖自動重新加入其 SRD 中的節點,以提供更高的可用性。下列為針對上述行為僅需執行的配置步驟:
當一次失去一個受管理節點或所有受管理節點皆失去時,此特性便能發揮最佳功效。
若將 /etc/rc.config.d/gwlmCtl 檔案中的 GWLM_AGENT_START 設為 1,便會在受管理節點開機時自動啟動 gWLM 代理程式 (gwlmagent)。代理程式接著檢查 /etc/opt/gwlm/deployed.config 檔案,以決定其 CMS。接下來,它會試圖與 CMS 聯繫,讓 CMS 重新部署其 SRD 視界。若無法聯繫 CMS,只要所有的節點均同意,便會部署 deployed.config 檔案中的 SRD。 一般而言,若 SRD 因節點即將當機、CMS 即將當機或網路通訊問題而受到干擾時,gWLM 便會嘗試重組 SRD。gWLM 會對 SRD 中的節點維持叢集的概念。叢集中,只有一個主節點,其餘皆為非主節點。若主節點與其餘的 SRD 失去聯繫,其餘的 SRD 在一致同意新主節點的情況下,仍可在無原有主節點的情況下以部份叢集 (partial cluster) 繼續運作。若非主節點與其餘的 SRD 失去聯繫,剩下的部份叢集仍可在沒有這個失去的節點的情況下繼續運作。主節點僅是忽略這個失去的節點,直到再次可使用它為止。 您可以使用 gwlmstatus 命令來監控可用性。此命令可讓您瞭解是否有任何主機無法重新加入某個節點的 SRD,以及 SRD 中的主機是否無回應。若需相關資訊,請參閱 gwlmstatus(1M)。
您可以配置下列與此自動重新啟動特性相關的 HP SIM 事件:
若需啟用和檢視這些事件的相關資訊,請參閱 gWLM 的「Events」功能表。 您可以利用 HP SIM 左側窗格的「事件表列」項目檢視這些事件。 下列各節說明處理這些事件的方式。 若您看見「Node Failed to Rejoin SRD on Start-up」事件:
如果您有一個 SRD 包含 n 個節點,且您收到了 n - 1 個「SRD Communication Issue」事件,但在第一個「SRD Communication Issue」事件後 5 分鐘之內並未收到任何「SRD Reformed with Partial Set of Nodes」事件 (假設配置時間間隔為 15 秒),您可能需要將受影響 SRD 中每一個受管理節點上的 gwlmagent 重新啟動: # /opt/gwlm/bin/gwlmagent --restart gWLM 若無法重組 SRD,請遵循下節的說明手動清理 SRD。 下列命令是清理 SRD 的進階命令。使用 gwlm undeploy 命令是典型自管理移除主機的建議方法。 自 A.02.50.00.04 版代理程式開始,您可以利用下列命令手動清理 SRD: # gwlm reset --host=主機 其中,主機指定欲清理具 SRD 的主機。 若此命令無作用,請使用下節中指定的程序。 本節當中的程序會清理 SRD,無關 SRD 中的代理程式版本為何。 gwlm 命令會在安裝期間新增至路徑中。在 HP-UX 系統上,此命令位於 /opt/gwlm/bin/ 內。在 Microsoft Windows 系統上,此命令的預設位置則是 C:\Program Files\HP\Virtual Server Environment\bin\gwlm\。不過安裝時可能會選擇不同的路徑。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||