| 臺灣-繁體中文 |
|
|
|
![]() |
HP Serviceguard Extension for Faster Failover A.01.00 版版本需知 > 第 1 章. Serviceguard
Extension for Faster Failover A.01.00 版版本需知版本內容 |
|
A.01.00 版是 Serviceguard Extension for Faster Failover (SGeFF) 的第一個版本。本產品可提供較快速的叢集重組作業,因此故障轉移的總時間較少。欲獲得快速故障轉移的好處,叢集必須安裝 Faster Failover 產品和下列特定配置需求 (如下所列)。 下列為包括的特性:
欲能支援,Faster Failover 叢集必須遵循數個配置需求,其需求列於下列的 《Faster Failover 叢集需求》。 下列為支援快速故障轉移所需的配置:
下列為 Faster Failover 叢集的必要事項。啟用 Faster Failover 叢集之前,請先仔細檢查以確認是否符合這些需求。輸入 Faster Failover 叢集的配置資訊後,請下達 cmcheckconf 命令並檢查 syslog 檔案是否有需求不符的訊息。
若需配置叢集的相關資訊,請參閱位於 《http://docs.hp.com/hpux/ha》 的《《管理 Serviceguard》》手冊。 若需 Serviceguard 命令及其參數的詳細資訊,請參閱 cmquerycl、 Faster Failover 是希望降低叢集故障轉移時間的極佳解決方案。若解決方案適用於您的情況,則下列為需考量的事項。 Serviceguard Extension for RAC (SGeRAC) 叢集的環境特別適合 Faster Failover。在 SGeRAC 環境中,Oracle RAC 接獲叢集成員變更時,即開始 Oracle RAC 配置作業。使用 Faster Failover,即可快速通知 Oracle RAC 有關任何叢集成員的變動,如此它便可快速地進行配置作業。 Faster Failover 的設計是安裝於具有一個仲裁伺服器及多個心跳的雙節點叢集上。基於此環境的考量,NODE_TIMEOUT 設為 1.6 秒、HEARTBEAT_INTERVAL 設為 0.8 秒,而 QS_TIMEOUT_EXTENSION 設為 0。若沒有安裝 Faster Failover,叢集重組需要 28 秒;若有安裝 Faster Failover,則僅需 5 秒。 然而,就大部份的安裝作業而言,5 到 8 秒的 NODE_TIMEOUT 設定值更適用於上述範例中使用的 1.6 秒。重新計算 5 至 8 秒的節點逾時,若沒有安裝 Faster Failover,則叢集重組需要 70 至 112 秒;若有安裝 Faster Failover,則僅需 15 至 24 秒。 QS_TIMEOUT_EXTENSION 增加的任何時間會直接加到故障轉移時間。 應用程式故障轉移時間短的叢集十分適合使用 SGeFF。請注意,Faster Failover 僅減少叢集重組的時間,而不會降低應用程式故障轉移的時間。您的應用程式若在重組後需花 30 分鐘重新啟動,則多個數秒鐘的叢集故障轉移時間對使用者而言並沒有顯著的差異。 Faster Failover 不允許叢集擁有兩個以上的節點。請仔細地評估您叢集將來的容量。日後若需增加節點,便需停用 Faster Failover,且需中止整個叢集,以停用叢集配置中的 Faster Failover。 Faster Failover 需要一個仲裁伺服器叢集鎖定。仲裁伺服器是免費的產品。訂購 Serviceguard 時,便可免費在 Serviceguard Distributed Components 光碟上取得仲裁伺服器軟體,亦可於 《http://www.hp.com/go/softwaredepot》 免費下載。 請確認仲裁伺服器已透過可靠的網路 (例如,不忙碌的心跳網路) 連線至叢集。節點若試圖取得仲裁伺服器鎖定,但無法及時到達時,整個叢集會關閉。 請考量在仲裁伺服器服務之 SGeFF 叢集外的叢集上,將仲裁伺服器本身配置為高可用性的套件。以協助確保叢集的高可用性,且此點不難做到。若需相關資訊,請參閱 Distributed Components 光碟或 《http://docs.hp.com》 -> high availability 處的《《仲裁伺服器版本需知》》。 較短的故障轉移時間有些許風險。若發生暫時性的問題,您可能想要一段短時間來進行回復。請考量叢集確認失效之可能性 (若非確定性的) 所允許的時間。 您不應將 SGeFF 安裝在其網路或 CPU 活動頻繁或大量尖峰活動的忙碌系統上,此舉除了可能會造成暫時性的問題外,還會導致心跳延遲。 務必仔細地設定並測試 SGeFF 叢集中的 NODE_TIMEOUT。 節點逾時不宜過短,導致無法容忍暫時性的問題或是暫時的中斷。請判斷在 Serviceguard 逾時並行動前應等待回復的時間。 節點逾時不宜過短,導致運作正常的節點的心跳延遲造成叢集開始重組,否則節點便會不必要地自叢集被剔除。或者,節點可及時回復並重新加入叢集;此時便會看到叢集已重組,但是成員與重組前相同。 由於 Faster Failover 叢集重組處理程序會立即結束,因此很可能具有暫時性問題的運作正常節點會因逾時而退出叢集。 請考量兩個具備 Faster Failover 有效配置的相同節點叢集。
請小心變更 NODE_TIMEOUT 的值,此值在 Faster Failover 叢集內的影響甚鉅。變更 SGeFF 叢集的逾時值時,請考量上述範例相同叢集的情況。
換言之,具備兩倍逾時的 SGeFF 叢集,叢集重組僅需要一半以下的時間。 Serviceguard Extension for Faster Failover A.01.00 版隨附下列手冊:
最新版本的 Serviceguard 相關使用手冊、版本需知,和白皮書 (包括本文件的任何更新資訊),皆可自 《http://docs.hp.com -> high availability》 取得。
若需支援資訊,包含最新的修補程式及已知問題資訊,可自 HP 的 IT 資源中心 (IT Resource Center) 網頁取得: 《http://itrc.hp.com》 (美洲及亞太地區) 按一下搜尋技術智識庫。雖然任何人均可存取此網站,但僅限具備有效支援合約的客戶方能登入與搜尋詳細的技術資訊。 欲接收建議修補程式、產品支援對照表,以及最新支援硬體的最新消息,請訂閱 ITRC 的「High Availability Program Tips and Issues Digest」。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||