回到網頁內容 臺灣-繁體中文
HP.com 首頁 產品資訊 支�#169;及驅動程式 解決方案 如何購買
» 聯絡 HP
進階選項
HP.com 首頁
使用 Serviceguard Extension for RAC > 第 2 章. Oracle 10g RAC 的 Serviceguard 配置

叢集通訊網路監控

» 

技術文件

PDF 格式的完整書籍
» 回饋意見
內容©韟像B開©l

 » 目錄

 » 索引

本節說明 SGeRAC/10g RAC 叢集中叢集通訊的多種網路配置,以及如何使用套件配置參數 CLUSTER_INTERCONNECT_SUBNET 以便自特定配置中的 Oracle 叢集通訊網路失效回復。

叢集通訊的單一網路

單一網路配置是最常用的網路安裝配置。在此類配置中,所有叢集通訊訊務都具有足以通過網路的頻寬。若有多重資料庫,那麼所有資料庫訊務都可通過相同的網路。

如圖 2-1 所示,CSS-HB 和 SG-HB 皆位於相同的網路中。主要和備用介面組可防止單一網路介面失效。若主要介面失效,Serviceguard 可監控網路並執行本機區域網路故障轉移 (CSS 和 RAC 不會察覺)。

附註: 模組式 (Modular) 和舊式 (Legacy) 套件提供具 CLUSTER_INTERCONNECT_SUBNET 參數的套件。僅能在叢集中的所有節點皆執行 SGeRAC A.11.18 版或更新版時,才可以配置具此參數的套件。若需相關資訊,請參閱可自 http://docs.hp.com/zh_tw -> 全部繁體中文產品文件取得的最新版《管理 Serviceguard 第十五版》使用指南。

圖 2-1 叢集通訊的單一網路

叢集通訊的單一網路

替代配置 ─ 利用低節點逾時的快速重新配置

若 Serviceguard 叢集配置參數 NODE_TIMEOUT 偏低,則高 RAC-IC 訊務可能會干擾 SG-HB 訊務並造成不必要的節點逾時。若無法增加 NODE_TIMEOUT,則使用 SG-HB 專屬的其他網路則可在 RAC-IC 訊務高的時候避免不必要的節點逾時。此項配置是針對具有兩個以上高 RAC-IC 訊務且需快速故障轉移 (低 Serviceguard 配置參數 NODE_TIMEOUT 的值) 之節點的叢集而設計的 。

圖 2-2 SG-HB/RAC-IC 訊務分隔

SG-HB/RAC-IC 訊務分隔

每個主要和備用組皆可防止單一失效。利用一個以上之子網路的 SG-HB,單一子網路失效將不會觸發 Serviceguard 重新配置。若子網路的 CSS-HB 失效,則除非使用了子網路監視功能,否則 CSS 將利用 CSS 叢集重新配置解決互連子網路失效。處理 CSS-HB 子網路失效前它會等待 CSS misscount 時間間隔 (透過關閉 CSS-HB 子網路在其上失效之節點)。

SGeRAC 配置中 CSS misscount 的預設值為 600 秒。

圖 2-2 所示,CLUSTER_INTERCONNECT_SUBNET 可與套件配置參數 NODE_FAIL_FAST_ENABLED 一起使用以監控 CSS-HB 網路。節點上 CSS-HB 子網路失效應透過關閉該節點來處理,因此,請針對監控 CSS-HB 子網路的套件將 NODE_FAIL_FAST_ENABLED 設定為 YES。當 Oracle Clusterware 配置為多節點套件且使用 CLUSTER_INTERCONNECT_SUBNET 以監控 CSS-HB 子網路時,若監控的子網路失效,則節點上 CSS-HB 子網路失效將會關閉多節點套件以及子網路失效之節點的應用例。

所有節點上 CSS-HB 子網路失效將導致多節點套件在逐一的節點上失效 (導致該節點關閉),而多節點套件和節點應用例將繼續提供服務給用戶端。

利用個別套件僅監控 CSS-HB 子網路,並讓 Oracle Clusterware 多節點套件與監控 CSS-HB 子網路的套件相依。針對 Oracle Clusterware 套件將 NODE_FAIL_FAST_ENABLED 參數設定為 NO,而針對監控 CSS-HB 子網路的套件 (如下列套件配置參數範例中所示的 Oracle 叢集互連子網路套件) 設定為 YES

附註: 由於 RAC-IC 網路與 CSS-HB 網路相同,因此請勿配置 RAC 應用例套件中的 CLUSTER_INTERCONNECT_SUBNET

以下為相關套件配置參數的範例:

Oracle Clusterware Package:PACKAGE_NAME CRS_PACKAGEPACKAGE_TYPE MULTI_NODE
LOCAL_LAN_FAILOVER_ALLOWED YESNODE_FAIL_FAST_ENABLED NODEPENDENCY_NAME CI-PACKAGEDEPENDENCY_CONDITION CI-PACKAGE=UPDEPENDENCY_LOCATION SAME_NODE
Oracle Cluster Interconnect Subnet Package:Package to monitor the CSS-HB subnetPACKAGE_NAME CI-PACKAGEPACKAGE_TYPE MULTI_NODELOCAL_LAN_FAILOVER_ALLOWED YESNODE_FAIL_FAST_ENABLED YESCLUSTER_INTERCONNECT_SUBNET192.168.1.0
附註: 若需變更某個 Oracle Clusterware 和 Serviceguard 叢集配置參數之準則的相關資訊,請參閱「變更叢集參數的準則」

替代配置 ─ 多重 RAC 資料庫

若在相同的叢集中具有多重的獨立 RAC 資料庫且單一網路頻寬不足,則可利用個別網路以提供不同資料庫的互連訊務。這將避免某一資料庫的 RAC-IC 訊務干擾另一資料庫的 RAC-IC 訊務。

圖 2-3 RAC/RAC-IC 訊務分隔 ─ 多重資料庫配置

RAC/RAC-IC 訊務分隔 ─ 多重資料庫配置

圖 2-3 所示,每個主要和備用組皆可防止單一失效。若子網路的 SG-HB (區域網路 1/區域網路 2) 失效,則 Serviceguard 會利用 Serviceguard 叢集重新配置解決子網路失效的問題。若 192.168.2.0 子網路 (區域網路 3 和 4) 失效,則除非使用 Serviceguard 子網路監視功能,否則 Oracle 應用例成員回復 (Instance Membership Recovery,IMR) 將解決互連失效的子網路。解決子網路失效的問題前,Oracle 會等待 IMR 的時間間隔。在 SGeRAC 配置中,IMR 時間間隔的預設值可能會高達 17 分鐘。

可為 RAC 應用例 MNP 配置 CLUSTER_INTERCONNECT_SUBNET,以監控與 CSS-HB 子網路不同的 RAC-IC 子網路。若 RAC 應用例使用了與 CSS-HB 網路不同的 RAC-IC 網路,那麼 RAC 應用例的參數檔 (SPFILE 或 PFILE) 就必須定義 cluster_interconnects 參數以保留 IP 位址給適當的子網路。CSS-HB 子網路不需特定的子網路監視功能,因為 Serviceguard 會監控子網路 (心跳) 並處理子網路失效。

使用 192.168.2.0 的資料庫應用例必須在其 SPFILE 或 PFILE 中將 cluster_interconnects 定義如下:

orcl1.cluster_interconnects=’192.168.2.1’orcl2.cluster_interconnects=’192.168.2.2’
附註: 若 RAC-IC 網路與 CSS-HB 網路相同,則請勿配置 RAC 應用例套件中的 CLUSTER_INTERCONNECT_SUBNET

以下為相關套件配置參數的範例:

Oracle RAC Instance PackagePACKAGE_NAME RAC_PACKAGEPACKAGE_TYPE MULTI_NODELOCAL_LAN_FAILOVER_ALLOWEDYESNODE_FAIL_FAST_ENABLED NOCLUSTER_INTERCONNECT_SUBNET 192.168.2.0
附註: 若需變更某個 Oracle Clusterware 和 Serviceguard 叢集配置參數之準則的相關資訊,請參閱「變更叢集參數的準則」

快速故障轉移配置 (SGeFF 和 SGeRAC)

利用 SGeFF 進行「快速故障轉移」(Faster Failover) 配置至少需要兩個個別的 SG-HB 網路,並限制為兩個節點。

圖 2-4 快速故障轉移配置

快速故障轉移配置

圖 2-4 所示,「快速故障轉移」配置在兩個沒有備用網路的主要網路上使用兩個 SG-HB,可實現最快速地判定節點失效和快速故障轉移。

  • SG-HB #1 的第一個主要網路 (區域網路 1)。

  • SG-HB #2 的第二個主要網路 (區域網路 2)。

  • CSS-HB 和 RAC-IC 的第三個主要和備用網路 (區域網路 3/區域網路 4)。

  • 受主要/備用網路保護的單一失效。

若子網路的 CSS-HB 失效,則除非使用了子網路監視功能,否則 CSS 將利用 CSS 叢集重新配置解決互連子網路失效。處理 CSS-HB 子網路失效前 CSS 會等待 CSS misscount 時間間隔 (Oracle Clusterware 配置參數)。SGeRAC 配置中 CSS misscount 的預設值為 600 秒。

CLUSTER_INTERCONNECT_SUBNET 可與 NODE_FAIL_FAST_ENABLED 選項一起使用以監控 CSS-HB 網路。節點上 CSS-HB 子網路失效應透過關閉該節點來處理,因此,請針對監控 CSS-HB 子網路的套件將 NODE_FAIL_FAST_ENABLED 設定為 YES。當 Oracle Clusterware 配置為多節點套件且使用 CLUSTER_INTERCONNECT_SUBNET 以監控 CSS-HB 子網路時,則節點上 CSS-HB 子網路失效將會關閉多節點套件以及子網路失效之節點的應用例。所有節點上 CSS-HB 子網路失效將導致多節點套件在逐一的節點上失效 (導致該節點關閉),而多節點套件和節點應用例將繼續提供服務給用戶端。

附註: 由於 RAC-IC 網路與 CSS-HB 網路相同,因此請勿配置 RAC 應用例套件中的 CLUSTER_INTERCONNECT_SUBNET

利用個別套件僅監控 CSS-HB 子網路,並讓 Oracle Clusterware 多節點套件與監控 CSS-HB 子網路的套件相依。針對 Oracle Clusterware 套件將 NODE_FAIL_FAST_ENABLED 設定為 NO,而針對監控 CSS-HB 子網路的套件 (Oracle 叢集互連子網路套件) 設定為 YES

以下為相關套件配置參數的範例:

Oracle Clusterware Package:PACKAGE_NAME CRS_PACKAGEPACKAGE_TYPE MULTI_NODE
LOCAL_LAN_FAILOVER_ALLOWED YESNODE_FAIL_FAST_ENABLED NODEPENDENCY_NAME CI-PACKAGEDEPENDENCY_CONDITION CI-PACKAGE=UPDEPENDENCY_LOCATION SAME_NODE
Oracle Cluster Interconnect Subnet Package:Package to monitor the CSS-HB subnetPACKAGE_NAME CI-PACKAGEPACKAGE_TYPE MULTI_NODELOCAL_LAN_FAILOVER_ALLOWED YESNODE_FAIL_FAST_ENABLED YESCLUSTER_INTERCONNECT_SUBNET192.168.1.0
附註: 若需變更某個 Oracle Clusterware 和 Serviceguard 叢集配置參數之準則的相關資訊,請參閱「變更叢集參數的準則」

變更叢集參數的準則

本節說明變更某 Oracle clusterware 與 Serviceguard 叢集配置參數之預設值的準則。

準則需視是否使用叢集互連子網路監視功能以監控 CSS HB 子網路而有所不同。

若使用叢集互連子網路監視功能

會使用叢集互連子網路監視功能

  1. 來監控 CSS-HB 網路,

  2. 若需要將下列任何叢集參數變更為預設值:

    • Oracle Clusterware 參數 CSS misscount

    • Serviceguard 叢集配置參數 NODE_TIMEOUT

    • Serviceguard HEARTBEAT_INTERVAL

    那麼 CSS misscount 參數應大於:

    • 195 秒

    • 40 倍的 Serviceguard NODE_TIMEOUT 加上 25 倍的 Serviceguard HEARTBEAT_INTERVAL + 120 秒

若未使用叢集互連子網路監視功能

會使用叢集互連子網路監視功能:

  1. 來監控 CSS-HB 網路,

  2. 若要變更下列任何參數的預設值:

    • Oracle Clusterware 參數 CSS misscount

    • Serviceguard 叢集配置參數 NODE_TIMEOUT

    那麼 CSS misscount 參數應大於:

    • 195 秒

    • 25 倍的 Serviceguard NODE_TIMEOUT + 15 秒。

叢集通訊網路監視程式的限制

叢集互連監視功能並不會協調任何處理子網路失效的功能 (包含本身)。多個子網路失效的失效處理可能會導致失去服務,例如:

  • 導致在雙節點叢集的所有節點上 CSS-HB 子網路和 SG-HB 子網路同時失效的雙切換失效(假設 CSS-HB 子網路與 SG-HB 子網路不同)。Serviceguard 可選擇保留一個節點,而互連子網路的失效處理則可選擇保留另一個節點以處理 CSS-HB 網路失效,因此將關閉這兩個節點。

    附註: 如欲降低多個子網路同時失效的風險,每個子網路必須具有其自身的網路基礎架構 (包含網路交換器)。
  • 導致在所有節點上 CSS-HB 子網路和 RAC-IC 網路同時失效的兩個交換器失效可能會造成失去服務 (假設 CSS-HB 子網路與 RAC-IC 網路不同)。處理互連子網路失效可選擇保留一個節點以供 CSS-HB 子網路失效使用,而在其他節點上保留 RAC 應用例以供 RAC-IC 子網路失效使用。最終由於資料庫應用例依賴 clusterware 以在該節點上執行,因此資料庫應用例將不會在任何節點上執行。

叢集互連監視功能的限制

除了以上的限制之外,叢集互連監視功能還具有以下的限制:

  • 必須在叢集中配置叢集鎖定裝置/仲裁伺服器/鎖定 Lun。

  • CLUSTER_INTERCONNECT_SUBNET 僅能用來監控 IPv4 子網路。

  • 如欲變更預設的 Serviceguard 叢集配置參數 NODE_TIMEOUTHEARTBEAT_INTERVAL 或 Oracle Clusterware 配置參數 CSS misscount,請將 Oracle misscount 設定為高於:

    • 195 秒

    • 40*SG_NODE_TIMEOUT + 25 * SG_HB_INTERVAL + 120 秒

可列印版本
隱私權聲明 使用範圍與著作權聲明
© Hewlett-Packard Development Company, L.P.