| 臺灣-繁體中文 |
|
|
|
![]() |
使用 Serviceguard Extension for RAC > 第 2 章. Oracle
10g RAC 的 Serviceguard 配置介面區 |
|
本節說明介面區,該區為 SGeRAC 和 《Oracle 10g 叢集軟體》與 RAC 之間預期的互動處。 NMAPI2 用戶端連結 SGeRAC 提供的 NMAPI2 程式庫,以提供群組成員服務。群組成員在 SGeRAC 叢集成員的上面一層,其中所有主要群組成員皆為叢集節點內的處理程序。叢集成員有節點名稱,而群組成員則有處理程序名稱。SGeRAC 群組成員變更時,SGeRAC 會將新的群組成員傳送至相同群組內的其他成員。 SGeRAC 利用心跳逾時 (heartbeat timeout) 以判斷是否有任何 SGeRAC 叢集成員失效,或是任何叢集成員無法與其他叢集成員通訊。CSS 亦針對 CSS 成員採用類似的機制。每一個 RAC 應用例群組成員也都有逾時機制,會觸發「應用例成員回復」(Instance Membership Recovery,IMR)。
Serviceguard 叢集心跳逾時根據使用者對可用性的需求而設定。叢集逾時、配置、重新配置演算法,以及重新配置時的動作都決定了 Serviceguard 叢集重新配置的時間。 當 SGeRAC 與 Oracle 叢集軟體位於相同的叢集時,安裝 Oracle 軟體時會將 CSS 逾時設為預設值 600 秒 (10 分鐘)。 您可利用 Oracle 工具配置逾時,且不應在未確認 CSS 逾時允許有足夠的時間重新配置 Serviceguard Extension for RAC (SGeRAC),和允許完成多重路徑 (若已配置) 重新配置作業的情況下變更它。 單點失效 (single point of failure) 時 (以節點失效為例),Serviceguard 會先重新配置,而 SGeRAC 會透過 NMAPI2 為 CSS 提供新的群組成員。若變更群組成員,則 SGeRAC 更新成員。收到新的群組成員後,CSS 會視需要依序初始其本身的回復動作,並將新群組成員傳送至 RAC 應用例。
Oracle 叢集軟體應在啟用它需要的共用儲存設備資源後再行啟動;共用儲存設備資源則是在完成 SGeRAC 啟動後啟用。Oracle 叢集軟體不應啟用任何共用的儲存設備。同樣地,在執行層級 (run level) 3 中止 SGeRAC 且自 Oracle 叢集軟體移除共用的儲存設備資源之前,應先中止 Oracle 叢集軟體。 Oracle 叢集軟體協助程式的監視作業透過 HP-UX init 處理程序初始的程式執行。SGeRAC 監視 Oracle 叢集軟體的範圍侷限於 CSS 是 NMAPI2 群組成員的用戶端和群組成員。SGeRAC 會在 CSS 進入與離開群組成員時,針對其餘的群組成員提供群組成員通知功能。 SGeRAC 支援使用 HP 共用邏輯容體管理員 (Shared Logical Volume Manager,SLVM)、叢集檔案系統 (Cluster File System,CFS),和叢集容體管理員 (Cluster Volume Manager,CVM) 的共用儲存設備;並非所有的 HP-UX 版本皆支援 CFS 和 CVM (在可支援的 HP-UX 版本;請參閱「關於 Symantec 的 Veritas CFS 和 CVM」)。 不得出現 /var/opt/oracle/oravg.conf 檔案,如此 Oracle 叢集軟體便不會啟用或停用任何共用的儲存設備。 透過 SLVM pvlink 或 CVM 動態多重路徑 (Dynamic Multipath,DMP) 支援多重路徑。在某些配置中,不需配置 SLVM 或 CVM 以提供多重路徑,因為儲存設備陣列會提供多重路徑。由於 Oracle 叢集軟體會透過定期的監視作業檢查 vote disk 共用裝置的可用性,因此多重路徑偵測與故障轉移的時間必須小於叢集同步化服務 (CSS) MISSCOUNT 所指定的 CRS 逾時。在 SGeRAC 配置中,CSS MISSCOUNT 值設為 600 秒。多重路徑的故障轉移時間通常在 30 到 120 秒之間 (若需多重路徑和 HP-UX 11i v3 的相關資訊,「關於多重路徑功能」)。 在節點與整個叢集失效方面,當使用 SLVM 鏡射且可使用 Oracle resilvering 時,建議將本機容體的鏡射回復規則設為完整鏡射重新同步化 (full mirror resynchronization,NOMWC,針對控制與 redo 檔案) 和無鏡射重新同步化 (no mirror resynchronization,NONE,針對資料檔案),因為 Oracle 會根據 redo 日誌對資料檔案執行 resilvering。
可配置 CRS 以自動啟動、監視、重新啟動,與中止聆聽程式 (listener)。 若未配置 CRS 在啟動 Oracle 叢集軟體時自動啟動聆聽程式,便可透過命令集或 SGeRAC 套件,利用支援的命令 (如 srvctl 與 lsnrctl) 自動啟動聆聽程式。若配置 SGeRAC 套件啟動聆聽程式,則 SGeRAC 套件會包含聆聽程式需要的虛擬 IP 位址。 SGeRAC 叢集提供網路監視功能。若為備援和由 Serviceguard 叢集監視的網路,Serviceguard 叢集在區域網路介面 (LAN) 之間提供本機故障轉移的能力,而利用使用者資料封包通訊協定 (User Datagram Protocol,UDP) 與傳輸控制通訊協定 (Transport Control Protocol,TCP) 的應用程式並不會察覺此功能。 若為 Serviceguard 中的虛擬 IP 位址 (浮動或套件 IP 位址),Serviceguard 亦在叢集節點間提供網路連線端點的遠端故障轉移能力,並在備援區域網路介面間為網路連線端點提供透通的本機故障轉移能力。
Serviceguard 支援多個心跳網路 (專用或公用)。Serviceguard 心跳網路可配置為與備援 LAN 連線的單一網路,或是與多個 LAN (單一或備援) 連線的多條連線。 同層通訊 (peer communication) 的 CSS IP 位址是固定的 IP 位址。當 CSS 心跳位於單一網路連線時,不支援多個心跳網路。為防止網路單點失效,應將 CSS 心跳網路配置為在 SGeRAC 監視下的備援實體網路。SGeRAC 不支援透過 Hyperfabric (HF) 網路的心跳,因此較佳的配置是讓 CSS 和 Serviceguard 共用相同的叢集互連。 每一組 RAC 應用例皆維護單一連線上的同層通訊,且在安裝 SGeRAC 的 HP-UX 上可能不支援多條連線。為防止網路單點失效,應將 RAC 叢集互連配置為在 Serviceguard 監視下的備援實體網路,並在 RAC 叢集互連失效時,讓 Serviceguard 採取行動 (本機故障轉移或關閉應用例套件,或兩者皆是)。Serviceguard 不直接監視 Hyperfabric 網路 (支援整合 Serviceguard 和 HF/EMS 監視程式)。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||