本 A.11.18 版的 Serviceguard 可以在 HP-UX 11i v2 和 11i v3 上執行,並增加新的功能。有某些平台相依的差異。
若需詳細資訊,請參閱下列子節和「聲明」。若需文件的相關資訊,請參閱「本版提供的文件 」。
HP-UX 11i v2 和 11i v3 通用的 Serviceguard 新功能 |
 |
HP-UX 11i v2 和 11i v3 上的 Serviceguard A.11.18 版支援 Symantec 的 Veritas 容體管理員 (Veritas Volume Manager,VxVM) 5.0 版、Veritas 叢集容體管理員 (Cluster Volume Manager,CVM) 5.0 版和 Veritas 叢集檔案系統 (Cluster File System,CFS) 5.0 版;
Serviceguard A.11.18 版亦支援這些產品的 4.1 版。
請參閱「HP-UX 11i v2 和 11i v3 上的 Veritas 5.0 支援」。
這是配置套件的新模組式 (modular) 方法;請參閱「關於模組式套件」。
此外,在列於「2008 年 4 月修補程式的新功能」和等節的修補程式中,Serviceguard 提供將現有 (舊式) 套件自動轉移至模組式套件的方法。請參閱「將舊式套件轉移至模組式套件」。
(有額外變更特別支援將 HP Toolkits 轉移至模組式的方法。將提供轉換的版本以支援未來的 Serviceguard 版本;請勿嘗試自行轉換 HP 工具組套件。)
您現在可以配置套件與另一個套件相依。請參閱「關於套件相依性」。
您現在可以建立多節點套件。請參閱「關於多節點套件」。
提供新的 Serviceguard 管理員圖形使用者介面 (GUI) 作為 System Management Homepage (SMH) 的插入附加程式。獨立式版本的 Serviceguard 管理員 (亦稱為管理站式管理版本) 已廢除。
請參閱「關於 Serviceguard 管理員 SMH 插入附加程式」。
以下為新的網路能力:
Serviceguard 現在支援跨子網路 (cross-subnet) 配置。
和所列的修補程式可讓您使用一個子網路和另一個子網路在部分節點上配置多個透過一個路由器連接的子網路,以取得叢集心跳和資料。請參閱「關於跨子網路配置」。
其他變更 (包括新增參數 SITE_NAME 和 SITE 至叢集配置檔) 支援需要其他軟體的可判別場地的災難容忍叢集 (site-aware disaster-tolerant clusters) (請參閱「其他資訊」)。
您現在可以在叢集仍在執行中時大幅變更叢集的網路配置;請參閱「新的線上網路配置能力」。
Serviceguard 現可支援自動連接埠聚合 (Auto Port Aggregation,APA) 的 LACP_AUTO (IEEE 802.3ad 連結聚合控制通訊協定) 模式,而每個連結聚合具有高達 32 個連接埠,且 MANUAL 和 FEC_AUTO (Cisco 專屬的 Fast EtherChannel) 模式的每個連結聚合可支援高達 8 個連接埠(先前 MANUAL 和 FEC_AUTO 的最大量為每個連結聚合為 4 個連接埠,而 LACP_AUTO 模式則不受支援)。
若需以 Serviceguard 施行 APA 的相關資訊,請參閱《HP Auto Port Aggregation (APA) Support Guide》和其他 APA 文件,發佈於 docs.hp.com 上的 IO Cards and Networking Software 集合。
Serviceguard 現可支援透過 APA 的虛擬區域網路 (VLAN) (先前已支援透過實體介面的 VLAN)。
若需相關資訊,請至 docs.hp.com/zh_tw 參閱 全部繁體中文產品文件 集合中最新版《管理 Serviceguard》第 3 章的「自動連接埠聚合」和「配置 VLAN」兩節。
您現在可以使用 cmmodnet 以啟用或停用目前配置在叢集內的 LAN_name(請注意,若是使用 cmmodnet 停用接著離開叢集的節點的 LAN_name;若節點重新加入叢集時便會重新啟用 LAN_name)。若在套件範圍外執行此命令,請務必謹慎;請參閱《管理 Serviceguard》「附錄 A」中的 cmmodnet 項目及 cmmodnet (1m) 線上援助頁。
您現在可以在叢集執行時變更時序配置參數;請參閱「新的線上時序配置能力」。
您現在可以將一個 LUN 配置為一個叢集鎖定。請參閱「關於鎖定 LUN」。
「2008 年 4 月修補程式的新功能」 和 兩節列示 VxVM 和 CVM 適用的一個新容體監視程式。請參閱「關於容體監視程式」。
您可以為叢集節點和仲裁伺服器之間的通訊配置替代的子網路。請參閱「替代的仲裁伺服器子網路」。
仲裁伺服器現在可支援最多由 300 個節點組成的 150 個叢集。
先前的限制是 50 個叢集和 100 個節點。仲裁伺服器 A.02.04 版和更新版支援新的限制。
有新的 Serviceguard 協助程式:
鎖定 LUN 協助程式 (Lock LUN Daemon):cmldisklockd
若是使用鎖定 LUN,會在叢集中的每一個節點上執行cmdisklockd,且是在節點加入叢集時由 cmcld 啟動。
網路管理員協助程式 (Network Manager Daemon):cmnetd
在每個執行 cmcld 的節點上執行。
公用程式協助程式 (Utility Daemon):cmlockd
在每個執行 cmcld 的節點上執行 (雖然 HP-UX 系統上的 Serviceguard 目前未實際使用)。
Serviceguard A.11.18 版使用一個新的叢集鎖定演算法,使用標準的延遲時間而不管鎖定裝置使用的匯流排或主機匯流排配接卡 (Host Bus Adapter,HBA) 類型。
由於支援 Serviceguard A.11.18 版的任何 HP-UX 版本已不再支援許多較舊、較慢的匯流排和 HBA,因此這才有可能發生。在某些情況下,新的演算法會大幅減少叢集重組的整體時間。
僅 HP-UX 11i v3 提供的 Serviceguard 新功能 |
 |
HP-UX 11i v3 上的 Serviceguard A.11.18 版裝置特殊檔案 (DSF) 支援 HP-UX 敏捷定址 (agile addressing),有時亦稱為 永久 LUN 綁定 (persistent LUN binding)。
請參閱「關於裝置特殊檔案 (DSF)」。
HP-UX 11i v3 的 Serviceguard A.11.18 支援 HP-UX 原生多重路徑和負載平衡。
請參閱「原生的多重路徑、Veritas DMP 與相關功能」。
以下為新的網路能力:
HP-UX 的 olrad -C 命令現可識別屬於 Serviceguard 叢集配置的網路介面卡 (NIC)。
您可以移除叢集配置中的 NIC,然後再從系統中移除該 NIC,而不需關閉叢集。請參閱「關於 olrad」。
Serviceguard 現在亦支援 APA 的區域網路監視模式。
Serviceguard 可支援任何大小的處理程序 ID (PID),最高可達 HP-UX 和節點之基本硬體結構所支援的最大值。
舊版 HP-UX 設定的限制為 30,000,但此限制自 HP-UX 11i v3 起即移除。若需相關資訊,請參閱 docs.hp.com 的白皮書《Number of Processes and Process ID Values on HP-UX》。
Serviceguard 現在在支援的 HP Integrity 伺服器上支援單元 OL* (線上新增與刪除單元) 作業。
如需在分區系統上使用 Serviceguard 的相關資訊,請參閱白皮書《HP Serviceguard Cluster Configuration for HP-UX 11i or Linux Partitioned Systems》,網址是:http://docs.hp.com ->High Availability ->Serviceguard ->White Papers。
您現在可以使用 FSWeb 公用程式配置 Serviceguard 叢集中的 LVM 容體 (若安裝附加產品 Serviceguard Extension for Real Application Cluster (SGeRAC),亦可配置 SLVM 容體)。
若需 FSWeb 的相關資訊,請參閱 fsweb(1m) 線上援助頁。
Serviceguard A.11.18 搭配使用列於「2008 年 4 月修補程式的新功能」之下的修補程式時可支援 LVM 2.0 容體群組。請參閱「關於 LVM 2.0」。
舊版首次出現的變更 |
 |
下列重要變更在發行舊版 Serviceguard《版本需知》時即已推出,或者會影響從舊版昇級。
自 Serviceguard A.11.16 版開始支援 HP Integrity 虛擬機器 (HP Integrity Virtual Machines,HPVM)。
Serviceguard A.11.18 版支援使用做為套件或叢集節點的 HPVM。若有任何 Serviceguard 叢集節點做為虛擬機器,則 Serviceguard 等待失效節點 I/O 完成所需的時間就會增加。
請參閱「關於 HPVM 和叢集重組時間」。
自 A.11.16 起,Serviceguard 使用存取控制規則 (Access Control Policies) 控制叢集的存取和管理控制。
請參閱「自 A.11.16 開始的存取變更」。
本版不提供的內容 |
 |
不再支援叢集心跳和資料網路的 Token Ring 與 FDDI。
HP-UX 11i v3 不再支援 Symantec 的 Veritas 容體管理員 (VxVM) 3.5 版,但支援 VxVM 4.1 版和 5.0 版。
cmviewcl 命令不再支援 -r 11.09 選項。
仍支援 -r 11.12 和 -r 11.16。若需相關資訊,請參閱 cmviewcl(1m) 線上援助頁
若需相關資訊,請參閱「聲明」和「輪替式昇級例外」。
關於模組式套件 |
 |
Serviceguard A.11.18 版允許您利用特定套件所需的函式組成之基本構成分子建立模組式套件。
 |
 |  |
 |
 | 重要: Serviceguard 並不強制您使用此項新方法。現有的套件 (亦稱為舊式套件) 仍照舊執行,且可透過舊式的方法維護;請參閱《管理 Serviceguard》第 7 章的「配置舊式套件」。您亦可新建舊式套件。若您使用的是 Serviceguard 工具組 (例如 Serviceguard NFS 工具組),請參閱該產品的文件。 |
 |
 |  |
 |
建立套件的新模組式方法提供下列優點:
現在所有套件參數均在同一處進行配置,亦即套件配置檔。
您不再需要建立及配送個別的套件控制檔。
外部命令集提供更好的應用程式整合方式。
這些外部命令集取代了舊式套件控制命令集中的「用戶定義函式」(Customer Defined Function)。您需要將這些命令集配送至可執行套件的所有節點。
模組式方法可讓您透過僅包含此套件所需函式的基本構成分子建立套件。
後續子節將提供更多資訊。亦請參閱:
《管理 Serviceguard》:第 4 章的「套件配置規劃」和第 6 章的「配置套件與套件的服務」
可編輯套件配置檔的註解由 cmmakepkg 命令和 cmmakepkg (1m) 線上援助頁輸出
下表顯示新套件模組和各模組包含的配置參數。
您可以使用 cmmakepkg -l (字母 l) 查看所有可用的模組清單,包括非 Serviceguard 模組 (例如 HP 工具組中提供的模組)。
cmmakepkg 命令行中至少必須指定一個基本模組 (或者是包含基本模組的 default 或 all)。粗體標示的參數為 A.11.18 的新參數,將於「新參數」中探討。
表 1-1 基本模組
| 模組名稱 | 參數 | 註解 |
|---|
| failover | | package_name | | module_name | | module_version | | package_type | | node_name | | auto_run | | node_fail_fast_enabled | | run_script_timeout | | halt_script_timeout | | successor_halt_timeout | | script_log_file | | operation_sequence | | log_level | | failover_policy | | failback_policy | | priority |
| 基本模組。故障轉移套件的主要基本構成分子。 |
| multi_node | | package_name | | module_name | | module_version | | package_type | | node_name | | auto_run | | node_fail_fast_enabled | | run_script_timeout | | halt_script_timeout | | successor_halt_timeout | | script_log_file | | operation_sequence | | log_level | | priority |
| 基本模組。多節點套件的主要基本構成分子。 |
| system_multi_node | | package_name | | module_name | | module_version | | package_type | | node_name | | auto_run | | node_fail_fast_enabled | | run_script_timeout | | halt_script_timeout | | successor_halt_timeout | | script_log_file | | operation_sequence | | log_level | | priority |
| 基本模組。系統多節點套件的主要基本構成分子。只有 HP 提供的應用程式支援系統多節點套件。 |
下列為自 A.11.18 版起使用的新參數,這些參數均適用於模組式套件,其中部份 (以下另外註明) 亦可用於舊式套件。除了「vxvm_dg_retry 」之外,舊版 Serviceguard 的配置檔或套件控制檔均無完全相對等的參數。
 |
 |  |
 |
 | 附註: 若需相關資訊,請參閱可編輯配置檔中由 cmmakepkg 命令和 cmmakepkg 線上援助頁輸出的註解。亦請參閱《管理 Serviceguard》第 4 章的「套件配置規劃」和第 6 章的「配置套件與套件的服務」 |
 |
 |  |
 |
係指模組名稱 (例如 failover、service 等)。請勿變更。用於相對路徑形式 (例如 sg/failover),作為 cmmakepkg 的參數,指定配置套件時所用模組(檔案常駐於 $SGCONF/modules 目錄中,若需 Serviceguard 目錄的說明,請參閱《管理 Serviceguard》第 5 章的「瞭解檔案的位置」)。
以秒數指定 Serviceguard 在中止此套件前等待依賴此套件之套件中止的時間長度,可為 0 到 4294 或 no_timeout。預設值為 no_timeout。模組式套件和舊式套件均適用。
no_timeout 代表 Serviceguard 將無限期等待相依的套件中止。
0 代表 Serviceguard 中止此套件前不會等待相依的套件中止。
若需相關資訊,請參閱《管理 Serviceguard》第 4 章中的「關於套件相依性」。
定義套件元件模組定義之命令集的啟動順序。若需相關資訊,請參閱套件配置檔。
此參數不可配置;請勿變更配置檔中的項目。
決定驗證套件後欲列印至 stdout 的資訊量,以及套件啟動與中止後欲列印至 script_log_file 的資訊量。有效值為 0 到 5:
指派 failover_policy 為 configured_node 的故障轉移套件優先權。有效值為 1 到 3000,或者是 no_priority。預設值為 no_priority。模組式套件和舊式套件均適用。
priority 可在套件啟動、需要故障轉移 (fail over) 或故障轉回 (fail back) 時用來滿足相依性:優先權高於其相依套件的套件可以強制其相依套件在它所選擇的節點上啟動或重新啟動,以符合其相依性。
若您指派優先權,則該優先權在此叢集中必須是獨特而唯一的。數目較小代表優先權較高,且數值式優先權高於 no_priority。HP 建議您以 20 的倍數指派值,在優先權中預留空間;否則,若要指派新套件的優先權時,您就必須重新變動所有現有的優先權。
若需相關資訊,請參閱《管理 Serviceguard》第 4 章中的「關於套件相依性」。
在跨子網路配置中,指定是否套件節點清單上的每個節點均可存取 monitored_subnet,抑或只有部分節點能夠存取。有效值為 PARTIAL,代表至少其中一個節點能夠存取子網路,但並非所有節點均能存取;以及代表所有節點均可存取子網路的 FULL。預設為 FULL,且若未指定 monitored_subnet_access,預設值便會生效。
亦請參閱「ip_subnet_node 」和「關於跨子網路配置」。
模組式套件的新參數。若為舊式套件,請參閱《管理 Serviceguard》第 7 章的「配置跨子網路故障轉移」。
在跨子網路配置中,指定在哪些節點上配置了 ip_subnet。若 ip_subnet下未列示任何 ip_subnet_node,則假設在此套件的 node_name 清單上所列之所有節點上配置該參數。
亦請參閱「monitored_subnet_access」和「關於跨子網路配置」。
模組式套件的新參數。若為舊式套件,請參閱《管理 Serviceguard》第 7 章的「配置跨子網路故障轉移」。
cluster_interconnect_subnet
指定 IPv4 位址。僅能在 Serviceguard Extension for Real Application Cluster (SGeRAC) 安裝作業的多節點套件中配置。模組式套件和舊式套件均適用。
(若需相關資訊,請參閱 http://docs.hp.com/zh_tw -> 全部繁體中文產品文件 - > Serviceguard Extension for Real Application Cluster (Serviceguard OPS Edition) 的《使用 Serviceguard Extension for RAC》)。
指定可利用 cmgetpkgenv(1m) 命令傳送至 external_pre_script、external_script (或兩者) 的環境變數。
變數名稱形式必須為 pev_<變數_名稱>,且僅包含文數字元和底線。底線 (_) 之前必須加上字母 pev (大寫或小寫)。
變數的名稱和值可包含的字元數上限分別為 MAXPATHLEN 個 (在 HP-UX 系統則為 1024 個)。
您可以定義一個以上的變數。若需相關資訊,請參閱《管理 Serviceguard》第 4 章的「關於外部命令集」,以及套件配置檔中的註解。
係指外部命令集的完整路徑名稱,於套件啟動期間,此外部命令集會在容體群組和磁碟群組啟動之前執行,且在容體群組和磁碟群組於套件關閉期間停用之後執行 (亦即套件啟動的第一個步驟與套件關閉的最後一個步驟)。
若指定多個 external_pre_script,則套件啟動期間將按照命令集輸入此檔案中的順序執行,而在套件關閉時則按照相反順序執行。
HP 提供外部命令集範本:$SGCONF/examples/external_script.template。
若需相關資訊,請參閱《管理 Serviceguard》第 4 章的「關於外部命令集」,以及套件配置檔中的註解。
係指外部命令集的完整路徑名稱。此命令集通常可用於啟動與中止構成套件主要函式的應用程式。
套件啟動時,會在啟動容體群組和檔案系統之後執行命令集並指派 IP 位址 (但在服務啟動前);而在套件因服務中止而關閉後、移除 IP 位址之前,同時容體群組和檔案系統均停用後,亦會執行命令集。
若指定多個 external_script,則套件啟動期間將按照命令集輸入此檔案中的順序執行,而在套件關閉時則按照相反順序執行。
HP 提供外部命令集範本:$SGCONF/examples/external_script.template。
若需相關資訊,請參閱《管理 Serviceguard》第 4 章的「關於外部命令集」,以及套件配置檔中的註解。
模組式套件和舊式套件參數使用的參數稍有不同。舊式參數容受支援,但如下表所示,部份參數在模組式套件中使用不同的名稱,而部份舊式參數在模組式套件中則已無相對等參數 (以粗體標示)。
表格中的星號代表該參數值的形式需求已變更 (例如必須使用哪些字元等)。請參閱「形式需求已變更的參數」。
表 1-3 舊式配置 ─ 檔案參數與相對等的模組式參數
| 舊式參數 | 模組式參數 |
|---|
| PACKAGE_NAME * | package_name* |
| PACKAGE_TYPE | package_type |
| NODE_NAME | node_name |
| AUTO_RUN | auto_run |
| NODE_FAIL_FAST_ENABLED | node_fail_fast_enabled |
RUN_SCRIPT | |
HALT_SCRIPT | |
| RUN_SCRIPT_TIMEOUT | run_script_timeout |
| HALT_SCRIPT_TIMEOUT | halt_script_timeout |
| SCRIPT_LOG_FILE | script_log_file |
| FAILOVER_POLICY | failover_policy |
| FAILBACK_POLICY | failback_policy |
| DEPENDENCY_NAME * | dependency_name* |
| DEPENDENCY_CONDITION | dependency_condition |
| DEPENDENCY_LOCATION | dependency_location |
| LOCAL_LAN_FAILOVER_ALLOWED | local_lan_failover_allowed |
| SUBNET | monitored_subnet |
| SERVICE_NAME* | service_name* |
| SERVICE_FAIL_FAST_ENABLED | service_fail_fast_enabled |
| SERVICE_HALT_TIMEOUT | service_halt_timeout |
| RESOURCE_NAME | resource_name |
| RESOURCE_POLLING_INTERVAL | resource_polling_interval |
RESOURCE_START | resource_start |
RESOURCE_UP_VALUE | resource_up_value |
VXVM_DG_RETRY | vxvm_dg_retry |
| STORAGE_GROUP | |
| USER_NAME | user_name |
| USER_HOST | user_host |
| USER_ROLE | user_role |
表 1-4 舊式控制 ─ 命令集參數與相對等的模組式參數
| 舊式參數 | 模組式參數 |
|---|
| SUBNET[] | ip_subnet |
| IP | ip_address |
SERVICE_NAME[] | service_name |
SERVICE_CMD[] | service_cmd |
SERVICE_RESTART[] | service_restart |
| DEFERRED_RESOURCE_NAME | resource_name |
| CONCURRENT_FSCK_OPERATIONS | concurrent_fsck_operations |
| CONCURRENT_MOUNT_AND_UMOUNT_ OPERATIONS | concurrent_mount_and_umount_ operations |
FS_UMOUNT_COUNT | fs_umount_retry_count |
FS_MOUNT_RETRY_COUNT | fs_mount_retry_count |
| LV[] | fs_name |
| FS[] | fs_directory |
| FS_TYPE[] | fs_type |
| FS_MOUNT_OPT[] | fs_mount_opt |
| FS_UMOUNT_OPT[] | fs_umount_opt |
| FS_FSCK_OPT[] | fs_fsck_opt |
| CONCURRENT_VGCHANGE_OPERATIONS | concurrent_vgchange_operations |
| VGCHANGE | vgchange_cmd |
| CVM_ACTIVATION_CMD | cvm_activation_cmd |
| VX_VOL | vxvol_cmd |
| VG[] | vg |
| CVM_DG[] | cvm_dg |
| VXVM_DG[] | vxvm_dg |
| DEACTIVATION_RETRY_COUNT | deactivation_retry_count |
KILL_PROCESSES_ACCESSING_RAW_DEVICES | kill_processes_accessing_raw_ devices |
從 Serviceguard A.11.18 版之後,下列參數值的規則已有所變更:
現在這些參數的值必須為:字元數上限為 39 個的任何名稱,其中:
否則僅使用文數字字元或點 (.)、連字號 (-),或底線 (_)
關於套件相依性 |
 |
自 Serviceguard A.11.17 開始,套件可依賴其他套件,亦即若套件所依賴的套件若未在某個節點中執行,則此節點亦無法啟動該套件。
在 Serviceguard A.11.17 版中,套件相依性僅適用於 HP 指定的特定應用程式,例如 HP 提供的多節點和系統多節點套件 (搭配 Veritas Cluster File System (CFS),且適用於支援 CFS 的系統)。
從 Serviceguard A.11.18 版開始,套件相依性不再受到限制;您可以使某個套件依賴執行於相同叢集節點上的任何其他套件 (根據《管理 Serviceguard》第 6 章說明的限制)。
若第一個套件必須要有第二個套件提供的服務才能夠 (或應該) 執行,則使第一個套件依賴第二個套件。例如,pkg1 可以執行受 pkg2 管理的資料庫之即時網路介面。此時即可使 pkg1 依賴 pkg2。
若需相關資訊,請參閱《管理 Serviceguard》第 4 章中的「關於套件相依性」。
關於多節點套件 |
 |
從 Serviceguard A.11.18 版開始,多節點套件不再受限於 HP 提供的應用程式;您可以建立任何用途的多節點套件。
多節點套件會在叢集中的多個節點同時執行。應用程式、服務、EMS 資源或子網路等失效的套件元件只會使套件在發生錯誤的節點上中止。
不可將可轉移的 IP 位址指派給多節點套件。
 |
 |  |
 |
 | 重要: 若套件使用容體群組,則必須在共用模式中啟動容體群組:vgchange -a s,需安裝 SGeRAC 附加產品才能使用。 |
 |
 |  |
 |
若需相關資訊,請參閱《管理 Serviceguard》的第 6 章。
請注意多節點套件和故障轉移套件之間在行為上的下列重要差異:
若多節點套件停用了 auto_run (在套件配置檔中設為 no),啟動叢集時將不會啟動此套件。您可以使用 cmmodpkg 來啟用套件切換並初次啟動該套件。但若您接著透過 cmhaltpkg 中止多節點套件,則只能利用 cmrunpkg 來重新啟動該套件,而不能使用 cmmodpkg。
若透過 cmhaltpkg 中止一個多節點套件,則不會停用套件切換功能。這表示若中止的套件配置為在重新開機的節點上執行,且符合其相依性時,該套件就會開始在該節點上執行。
初次啟動一個多節點套件時 (無論是在叢集啟動時,或者是在 auto_run 設為 no,接著啟用套件切換的情況下,於後續啟動時啟動),所有相依套件都會在其主要節點上啟動。但若一個多節點套件與其相依套件均被中止,接著再重新啟動該多節點套件,則重新啟動了套件切換功能的相依套件將在一個多節點套件應用例開機的第一個適當節點上啟動;此節點不得為相依套件的主要節點。
為確保當需要重新啟動相依故障轉移套件的多節點套件時,相依故障轉移套件會在其主要節點上重新啟動,重新啟動多節點套件之前,請先確認未重新啟用相依套件的套件切換功能。接著您可以使用 cmrunpkg 並指定相依故障套件啟動的節點來重新啟動相依故障轉移套件,也可以在完成多節點套件開機之後啟用這些套件的套件切換功能。
其他套件變更 |
 |
「2008 年 4 月修補程式的新功能」和等節所列的修補程式提供下列新功能:
Serviceguard 現在提供套件為何會關閉的說明資訊。
套件中止時,Serviceguard 會將套件控制命令集中的新環境變數 SG_HALT_REASON 設定為下列其中一個值:
failure ─ 會在套件所依賴的子網路、資源或服務失效而導致套件中止時設定
user_halt ─ 會在 cmhaltpkg 或 cmhaltnode 命令,或是 Serviceguard 管理員中對應的動作中止套件時設定
automatic_halt ─ 會在某個套件因為所依賴的套件失效而自動故障轉移,或是自動故障轉回其主要節點 (failback_policy = automatic) 時設定
您可以在套件中新增自訂程式碼來諮詢 (interrogate) 此變數、判斷套件中止的原因,以及進行適當的動作。若為舊式套件,請將程式碼放在套件命令集中 CUSTOMER DEFINED FUNCTIONS 區內的 customer_defined_halt_cmds() 函式中;若為模組式套件,請將程式碼放在套件的外部命令集 (請參閱「external_script」)。
例如,若管理者將中止某個資料庫套件 (將 SG_HALT_REASON 設為 user_halt),您可能會希望自訂的程式碼依序執行資料庫關機;另一方面,如果 SG_HALT_REASON 設為 failure,代表套件異常中止 (例如因它所依賴的服務失效),則可能需要強制性的關機。
cmviewcl -v -f line 有一個新的欄位 (last_halt_failed),顯示上一次在節點上啟動某個套件的中止命令集是否成功。若中止命令集成功執行、自該節點加入叢集後尚未執行,或自配置該套件在某個節點上執行後尚未執行,此值為 no,否則此值一律為 yes。
套件配置檔中的新參數 vxvm_dg_retry 可讓您指定應重試失效的 VxVM 匯入作業;請參閱「vxvm_dg_retry 」。
關於跨子網路配置 |
 |
自 Serviceguard A.11.18 版起,在安裝列於和的修補程式後,Serviceguard 即可讓您配置多個透過一個路由器連接的子網路,讓部分節點使用一個子網路,而其他節點使用其他子網路,以取得叢集心跳和資料。
跨子網路配置允許:
自動從一個子網路上的節點進行套件故障轉移至另一個子網路上的節點。
叢集和套件配置作業會受到下列影響:
您必須使用 cmquerycl 的 -w full 選項才能跨路由器探索到實際的或潛在的節點和子網路。
若為模組式套件,您必須在套件配置檔中配置兩個新的參數,才能允許套件跨子網路故障轉移:
ip_subnet_node ─ 指示在哪些節點上配置子網路
monitored_subnet_access ─ 指示是在所有節點 (FULL) 或只在部分 (PARTIAL) 節點上配置子網路
(若為舊式套件,請參閱《管理 Serviceguard》第十五版第 7 章的「配置跨子網路故障轉移」。)
您不應使用萬用字元 (*) 做為套件配置檔中的 node_name,因為這樣可能會讓套件跨越子網路故障轉移到另一個子網路上的節點 (而此時同一子網路上可能有一個更適當的節點);反之,請依您偏好的順序列出節點。
會有下列限制:
叢集中的所有節點必須屬於同一個網域 (也就是說,完全合格的網域名稱 (fully-qualified domain name) 的網域 (domain) 部分必須相同)。
心跳網路中的延遲 (latency) 必須少於 200 毫秒。
每個節點上的每個心跳子網路必須個別實體路由至另一個節點上的心跳子網路;也就是說,每個心跳路徑實體上必須是獨立的:
心跳必須使用靜態路由;必須在每個節點上配置靜態路由項目,透過不同的路徑來路由心跳。
由於 Symantec 的 Veritas Cluster File System (CFS) 需要節點之間有連結層級的訊務 (link-level traffic,LLT) 通訊,因此不可在單獨搭配 CFS 的跨子網路配置中配置 Serviceguard。
不過,在搭配 Serviceguard 和 Serviceguard Extension for Oracle RAC (SGeRAC) 等 HP 附加產品的跨子網路配置中,CFS 是受到支援的;請參閱下列文件。
每個套件子網路必須在本機橋接網路 (local bridged net) 上配置一個備用的介面。子網路之間可以共用備用介面。
在此環境中部署應用程式必須小心謹慎;請參閱《管理 Serviceguard》第十五版第 4 章的「應用程式部署的涵義」。
若相關節點上的「主機名稱區域網路」(hostname LAN) 失效,cmrunnode 將會失敗(「主機名稱區域網路」是指配置節點主機名稱所解析至的 IP 位址的公用區域網路)。
若為套件配置檔中的 PARTIAL monitored_subnet_access 配置了 monitored_subnet,則亦須在該套件的 node_name 清單中的至少一個節點上配置。反過來說,若針對此套件所監控的所有子網路均配置了 PARTIAL 存取,則 node_name 清單上的每個節點均至少須配置其中一個子網路。
如同其他配置,若在節點上配置且在套件配置檔中指定為受監控子網路的子網路未開機,則套件將不會在該節點上啟動。
您無法使用 Serviceguard 管理員配置跨子網路叢集或套件。
若需在跨子網路環境中配置叢集和套件的詳細資訊,請參閱《管理 Serviceguard》第十五版中的下列章節 (本書可在 http://docs.hp.com -> High Availability -> Serviceguard 取得):第 5 章的「取得跨子網路資訊」、第 4 章的「關於跨子網路故障轉移」,以及 (僅限舊式套件) 第 7 章的「配置跨子網路故障轉移」。
新的線上網路配置能力 |
 |
您現在可以在叢集仍在執行中時大幅變更叢集的網路配置。
您可執行的線上作業包含:
利用 HEARTBEAT_IP 或 STATIONARY_IP 新增網路介面。
利用 HEARTBEAT_IP 或 STATIONARY_IP 刪除網路介面。
將現有介面的指定從 HEARTBEAT_IP 變更為 STATIONARY_IP (或相反)。
變更 NETWORK_POLLING_INTERVAL 和 NETWORK_FAILURE_DETECTION 參數。
在某一個異動作業 (cmapplyconf) 中組合這些項目 (會有以下限制)。
會有下列限制:
您不可同時變更所有心跳的配置,或是變更或刪除僅存的配置的心跳。
至少一個運作中的心跳 (最好具有備用) 必須維持未變更的狀態。
在 CVM 配置中,您只能新增和刪除資料區域網路和 IP 位址。
使用 CVM 的叢集正在執行中時,您無法變更心跳配置。
除非這些介面以及叢集配置中的其他所有介面皆運作正常,否則無法新增介面或修改其特性。
配置中必須沒有不良的 NIC 或無法作用的或本機切換子網路,除非您本來就是想要在相同的作業中刪除這些元件。
若您欲將現有介面的指定從 HEARTBEAT_IP 變更為 STATIONARY_IP (或相反),那麼叢集中其他所有節點上相同子網路的所有同層網路介面也必須進行相同的變更。
除非所有節點都具有共通的子網路,否則無法將介面的指定從 STATIONARY_IP 變更為 HEARTBEAT_IP。
請記住 HEARTBEAT_IP 必須位於所有節點的相同子網路上,且必須為 IPv4 位址。
刪除主要介面時必定會刪除任何備用介面,除非另一個未刪除的主要介面使用了該備用介面。
已配置使用節點中之子網路或 IP 位址的套件已在該節點上執行時,無法刪除該子網路或該 IP 位址 (如 monitored_subnet、ip_subnet 或 ip_address)
您無法在一個單一異動作業 (cmapplyconf) 中變更叢集所使用的介面 IP 配置。
您必須先刪除叢集配置中的 NIC,接著重新配置 NIC (例如使用 ifconfig (1m)),然後再將 NIC 新增回該叢集中。
您必須進行此作業的時機範例包含:
若需相關資訊和範例,請參閱《管理 Serviceguard》第 7 章的「變更叢集網路配置」。
您可以使用 cmquerycl -c <叢集_名稱> -C <檔案名稱> 產生一個文字檔 (檔案名稱),顯示叢集目前的配置,還有其他 (加上註釋符號 (井字號) 的) 目前不屬於叢集配置但是可以加入的子網路項目。
例如,假設雙節點叢集 cluster1 中的節點 ftsys9 和 ftsys10 共用子網路 15.13.170.0,且您想將它以心跳子網路增至叢集配置。您可以執行 cmquerycl -c 以取得叢集配置範本檔 (其中包括該子網路上已加上註釋符號的介面項目);例如:
cmquerycl -c cluster1 -C clconfig.ascii
結果 clconfig.ascii 檔案的網路部份如下所示:
NODE_NAME ftsys9
NETWORK_INTERFACE lan1
HEARTBEAT_IP 192.3.17.18
#NETWORK_INTERFACE lan0
#STATIONARY_IP 15.13.170.18
NETWORK_INTERFACE lan3
# Possible standby Network Interfaces for lan1, lan0:lan2.
NODE_NAME ftsys10
NETWORK_INTERFACE lan1
HEARTBEAT_IP 192.3.17.19
#NETWORK_INTERFACE lan0
# STATIONARY_IP 15.13.170.19
NETWORK_INTERFACE lan3
# Possible standby Network Interfaces for lan0, lan1:lan2 |
您現在可以去除項目的註釋符號並套用新的配置;若需相關資訊,請參閱《管理 Serviceguard》的第 7 章「叢集執行時變更叢集網路配置」。
關於鎖定 LUN |
 |
叢集鎖定 (cluster lock) 為平局決勝 (tie-breaker),確保不會將叢集重組成相等的兩半;若需相關資訊,請參閱《管理 Serviceguard》第 3 章的「防止核心分離的叢集仲裁」。
LUN 代表邏輯單元編號 (Logical Unit Number)。LUN 可代表單一實體磁碟,但現今通常用於 SAN (儲存設備區域網路,Storage Area Network) 或 NAS (網路連線儲存設備,Network-Attached Storage) 相關內容,代表從一或多個實體磁碟衍生出的虛擬實體。
從 Serviceguard A.11.18 版開始,您可以將 LUN 配置為叢集鎖定。
選擇鎖定 LUN 的裝置時,請記住下列幾點:
節點和鎖定 LUN 之間僅能透過光纖通道連接;不支援平行 SCSI。
當您將 LUN 配置為鎖定 LUN 時,便會損毀 LUN 上所有現存的資料。
鎖定 LUN 不可同時用於 LVM 實體容體或 VxVM 或 CVM 磁碟群組。
您不需要備份鎖定 LUN 資料,事實上亦沒有備份此資料的方法。
鎖定 LUN 僅需要相當小的儲存設備空間,大約 100 KB。
若需相關資訊,請參閱《管理 Serviceguard》第 5 章的「設定鎖定 LUN」,以及 cmdisklock(1m) 線上援助頁。
關於裝置特殊檔案 (DSF) |
 |
HP-UX 11i v2 版以及以上的版本使用硬體路徑編碼的裝置檔案的命名慣例。例如,命名為 /dev/dsk/c3t15d0 的裝置檔案係指 SCSI 控制器應用例 3、SCSI 目標 15,和 SCSI LUN 0。HP-UX 11i v3 引進一個稱為敏捷定址 (agile addressing,有時亦稱為永久 LUN 綁定,persistent LUN binding) 的裝置檔案新命名法。
在敏捷定址慣例下,不再將硬體路徑名稱編碼在儲存設備裝置的名稱內;取而代之的是,每一個裝置檔案名稱反應一個獨有的應用例編號 (例如 /dev/[r]disk/disk3),無需隨硬體路徑變更。
敏捷定址是新 11i v3 安裝作業的預設內容,但是 I/O 子系統仍會重新組織 11i v3 前的裝置檔案,此重組的檔案自 11i v3 起即稱為舊式裝置檔案 (legacy device file)。使用新命名法的裝置檔案稱為永久裝置檔案 (persistent device file)。
當您昇級至 HP-UX 11i v3 後,就會建立一組新的永久裝置檔案,但現行的舊式裝置檔案仍會保持完整,且預設會由 HP-UX 和 Serviceguard 繼續使用。
意即,雖然您應認真地考量敏捷定址效益,但是無需在昇級至 11i v3 時轉移它 (請參閱 docs.hp.com 中 Network and Systems Management -> Storage Area Management 下的白皮書《The Next Generation Mass Storage Stack》)。轉移包含修改系統和應用程式的配置檔與命令集,以使用永久裝置檔案以及新命令和選項 (在某些情況下),http://www.docs.hp.com 中的白皮書《Migrating from HP-UX 11i v2 to HP-UX 11i v3》和《LVM Migration from Legacy to Agile Naming Model HP-UX 11i v3》說明轉移程序。
若您冷安裝 HP-UX 11i v3,則會自動同時建立舊式和永久的裝置檔案組。在此情況下,安裝程序預設會配置系統裝置 (如開機、root、置換和傾印裝置) 以使用永久裝置檔案,這表示系統配置檔 (如 /etc/fstab 和 /etc/lvmtab) 包含參考永久裝置檔案,但 Serviceguard 的運作並不受此影響。
 |
 |  |
 |
 | 小心: 若是將叢集鎖定磁碟用作平局決勝 (tie-breaker) 服務,便不能在輪替式昇級期間轉移敏捷定址,因為此舉涉及變更叢集配置內容。但是在某些情況下,您無需關閉叢集即可將叢集鎖定裝置檔案名稱轉移至新的機制。若需需求與程序的相關資訊,請參閱《管理 Serviceguard》第 7 章中的「昇級叢集鎖定配置」。 |
 |
 |  |
 |
 |
 |  |
 |
 | 附註: 若可能,某些節點轉移至敏捷定址而在某些節點上使用舊式的 DSF,雖不是最佳實務,但讓您能視需要在不同時間轉移不同的節點。 |
 |
 |  |
 |
若需敏捷定址的相關資訊,請參閱可自 http://docs.hp.com 取得的下列文件:
HP-UX 《系統管理者指南》的《邏輯容體管理》一冊 (位於全部繁體中文產品文件 -> 系統管理集合)
《HP-UX 11i v3 安裝與更新指南》(位於全部繁體中文產品文件 -> 安裝與更新集合)
下列白皮書:
《The Next Generation Mass Storage Stack》 (位於 Network and Systems Management -> Storage Area Management 下)
《Migrating from HP-UX 11i v2 to HP-UX 11i v3》
《HP-UX 11i v3 Native Multi-Pathing for Mass Storage》
《LVM Migration from Legacy to Agile Naming Model HP-UX 11i v3》
亦請參閱 HP-UX 11i v3 intro(7) 線上援助頁。
關於 LVM 2.0 |
 |
邏輯容體管理員 (Logical Volume Manager,LVM) 2.0 容體群組會移除 LVM 1.0 容體群組所強制的一些限制,可用於搭配 Serviceguard A.11.18 版及列於「2008 年 4 月修補程式的新功能」下之 Serviceguard 修補程式執行 HP-UX 11i v3 0803 Fusion 的系統。
若需詳細資訊,請參閱《LVM 2.0 Volume Groups in HP-UX 11i v3》白皮書,位於 docs.hp.com -> 11i v3 -> LVM Volume Manager。若需 HP-UX 11i v3 上之 LVM 的所有其他相關資訊,請參閱同一個位址上之《HP-UX 系統管理者指南》的《邏輯容體管理》一冊 (第 3 冊)。
關於 olrad |
 |
移除系統中的介面之前,必須先移除叢集配置中的區域網路或 VLAN 介面。您不需關閉叢集即可進行此作業。
HP-UX 11i v3 提供了 olrad 命令的新選項 olrad -C,可協助您判斷某個介面是否為叢集配置的一部份:執行 olrad -C,並以受影響的 I/O 插槽 ID 作為引數。
若 NIC 屬於叢集配置的一部分,那麼您將可見到一個告訴您繼續進行下一步驟前需先將 NIC 自配置中移除的警告訊息。若需 olrad 的相關資訊,請參閱 olrad(1M) 線上援助頁。
移除叢集配置中的 NIC 後,您便可以從 HP-UX 11i v3 叢集節點中移除該 NIC,不需執行 olrad -d 關閉系統。
若需相關資訊,請參閱《管理 Serviceguard》第 7 章的「移除節點中的 LAN 或 VLAN 介面」。
關於容體監視程式 |
 |
僅監視 Serviceguard 叢集中的每個實體磁碟並不能適當監控由 Symantec 提供之 Veritas 容體群組 (VxVM) 管理的容體,因為實體容體失效不見得是會觸發故障轉移的關鍵性失效 (例如,鏡射容體失效就不算是關鍵性失效)。
基於此原因,且由於 VxVM 可讓您線上調整容體大小,因此很難判斷必須監控哪些實體磁碟才能確保邏輯容體得以順利運作。「2008 年 4 月修補程式的新功能」和所列修補程式隨附的 HP Serviceguard VxVM 容體監視程式 (Volume Monitor) 提供持續監控 VxVM 容體的有效方法。VxVM 監視程式支援 Veritas 容體管理員 3.5, 4.1 版和 5.0 版,以及 Veritas 叢集容體管理員 (CVM) 3.5, 4.1 版和 5.0 版。
您需將 VxVM 容體監視程式配置為需存取 VxVM 容體之套件內的服務。
受監控的容體因無法存取而失效時,監控服務將會結束,從而導致套件於目前的節點上失效。如同其他任何故障轉移套件般,套件的故障轉移行為取決於其配置的設定。
cmvxserviced [-h, --help] [-v, --version]
[-O, --log-file