| 臺灣-繁體中文 |
|
|
|
![]() |
使用 Serviceguard Extension for RAC > 第 2 章. Oracle 10g RAC 的 Serviceguard 配置叢集通訊網路監控 |
|
本節說明 SGeRAC/10g RAC 叢集中叢集通訊的多種網路配置,以及如何使用套件配置參數 CLUSTER_INTERCONNECT_SUBNET 以便自特定配置中的 Oracle 叢集通訊網路失效回復。 單一網路配置是最常用的網路安裝配置。在此類配置中,所有叢集通訊訊務都具有足以通過網路的頻寬。若有多重資料庫,那麼所有資料庫訊務都可通過相同的網路。 如圖 2-1 所示,CSS-HB 和 SG-HB 皆位於相同的網路中。主要和備用介面組可防止單一網路介面失效。若主要介面失效,Serviceguard 可監控網路並執行本機區域網路故障轉移 (CSS 和 RAC 不會察覺)。
若 Serviceguard 叢集配置參數 NODE_TIMEOUT 偏低,則高 RAC-IC 訊務可能會干擾 SG-HB 訊務並造成不必要的節點逾時。若無法增加 NODE_TIMEOUT,則使用 SG-HB 專屬的其他網路則可在 RAC-IC 訊務高的時候避免不必要的節點逾時。此項配置是針對具有兩個以上高 RAC-IC 訊務且需快速故障轉移 (低 Serviceguard 配置參數 NODE_TIMEOUT 的值) 之節點的叢集而設計的 。 每個主要和備用組皆可防止單一失效。利用一個以上之子網路的 SG-HB,單一子網路失效將不會觸發 Serviceguard 重新配置。若子網路的 CSS-HB 失效,則除非使用了子網路監視功能,否則 CSS 將利用 CSS 叢集重新配置解決互連子網路失效。處理 CSS-HB 子網路失效前它會等待 CSS misscount 時間間隔 (透過關閉 CSS-HB 子網路在其上失效之節點)。 SGeRAC 配置中 CSS misscount 的預設值為 600 秒。 如圖 2-2 所示,CLUSTER_INTERCONNECT_SUBNET 可與套件配置參數 NODE_FAIL_FAST_ENABLED 一起使用以監控 CSS-HB 網路。節點上 CSS-HB 子網路失效應透過關閉該節點來處理,因此,請針對監控 CSS-HB 子網路的套件將 NODE_FAIL_FAST_ENABLED 設定為 YES。當 Oracle Clusterware 配置為多節點套件且使用 CLUSTER_INTERCONNECT_SUBNET 以監控 CSS-HB 子網路時,若監控的子網路失效,則節點上 CSS-HB 子網路失效將會關閉多節點套件以及子網路失效之節點的應用例。 所有節點上 CSS-HB 子網路失效將導致多節點套件在逐一的節點上失效 (導致該節點關閉),而多節點套件和節點應用例將繼續提供服務給用戶端。 利用個別套件僅監控 CSS-HB 子網路,並讓 Oracle Clusterware 多節點套件與監控 CSS-HB 子網路的套件相依。針對 Oracle Clusterware 套件將 NODE_FAIL_FAST_ENABLED 參數設定為 NO,而針對監控 CSS-HB 子網路的套件 (如下列套件配置參數範例中所示的 Oracle 叢集互連子網路套件) 設定為 YES。
以下為相關套件配置參數的範例:
若在相同的叢集中具有多重的獨立 RAC 資料庫且單一網路頻寬不足,則可利用個別網路以提供不同資料庫的互連訊務。這將避免某一資料庫的 RAC-IC 訊務干擾另一資料庫的 RAC-IC 訊務。 如圖 2-3 所示,每個主要和備用組皆可防止單一失效。若子網路的 SG-HB (區域網路 1/區域網路 2) 失效,則 Serviceguard 會利用 Serviceguard 叢集重新配置解決子網路失效的問題。若 192.168.2.0 子網路 (區域網路 3 和 4) 失效,則除非使用 Serviceguard 子網路監視功能,否則 Oracle 應用例成員回復 (Instance Membership Recovery,IMR) 將解決互連失效的子網路。解決子網路失效的問題前,Oracle 會等待 IMR 的時間間隔。在 SGeRAC 配置中,IMR 時間間隔的預設值可能會高達 17 分鐘。 可為 RAC 應用例 MNP 配置 CLUSTER_INTERCONNECT_SUBNET,以監控與 CSS-HB 子網路不同的 RAC-IC 子網路。若 RAC 應用例使用了與 CSS-HB 網路不同的 RAC-IC 網路,那麼 RAC 應用例的參數檔 (SPFILE 或 PFILE) 就必須定義 cluster_interconnects 參數以保留 IP 位址給適當的子網路。CSS-HB 子網路不需特定的子網路監視功能,因為 Serviceguard 會監控子網路 (心跳) 並處理子網路失效。 使用 192.168.2.0 的資料庫應用例必須在其 SPFILE 或 PFILE 中將 cluster_interconnects 定義如下:
以下為相關套件配置參數的範例:
利用 SGeFF 進行「快速故障轉移」(Faster Failover) 配置至少需要兩個個別的 SG-HB 網路,並限制為兩個節點。 如圖 2-4 所示,「快速故障轉移」配置在兩個沒有備用網路的主要網路上使用兩個 SG-HB,可實現最快速地判定節點失效和快速故障轉移。
若子網路的 CSS-HB 失效,則除非使用了子網路監視功能,否則 CSS 將利用 CSS 叢集重新配置解決互連子網路失效。處理 CSS-HB 子網路失效前 CSS 會等待 CSS misscount 時間間隔 (Oracle Clusterware 配置參數)。SGeRAC 配置中 CSS misscount 的預設值為 600 秒。 CLUSTER_INTERCONNECT_SUBNET 可與 NODE_FAIL_FAST_ENABLED 選項一起使用以監控 CSS-HB 網路。節點上 CSS-HB 子網路失效應透過關閉該節點來處理,因此,請針對監控 CSS-HB 子網路的套件將 NODE_FAIL_FAST_ENABLED 設定為 YES。當 Oracle Clusterware 配置為多節點套件且使用 CLUSTER_INTERCONNECT_SUBNET 以監控 CSS-HB 子網路時,則節點上 CSS-HB 子網路失效將會關閉多節點套件以及子網路失效之節點的應用例。所有節點上 CSS-HB 子網路失效將導致多節點套件在逐一的節點上失效 (導致該節點關閉),而多節點套件和節點應用例將繼續提供服務給用戶端。
利用個別套件僅監控 CSS-HB 子網路,並讓 Oracle Clusterware 多節點套件與監控 CSS-HB 子網路的套件相依。針對 Oracle Clusterware 套件將 NODE_FAIL_FAST_ENABLED 設定為 NO,而針對監控 CSS-HB 子網路的套件 (Oracle 叢集互連子網路套件) 設定為 YES 。 以下為相關套件配置參數的範例:
本節說明變更某 Oracle clusterware 與 Serviceguard 叢集配置參數之預設值的準則。 準則需視是否使用叢集互連子網路監視功能以監控 CSS HB 子網路而有所不同。 會使用叢集互連子網路監視功能
叢集互連監視功能並不會協調任何處理子網路失效的功能 (包含本身)。多個子網路失效的失效處理可能會導致失去服務,例如:
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||