回到網頁內容 臺灣-繁體中文
HP.com 首頁 產品資訊 支�#169;及驅動程式 解決方案 如何購買
» 聯絡 HP
進階選項
HP.com 首頁
MC/ServiceGuard A.11.14版版本需知 第二版 > 第 1 章. MC/ServiceGuard A.11.14版版本需知 第二版

版本的修補程式和修正程式

» 

技術文件

PDF 格式的完整書籍
» 回饋意見
內容©韟像B開©l

 » 目錄

A.11.14版內已併入MC/ServiceGuard A.11.01版到A.11.13版的內容,包括 A.11.09版和A.11.13版的修補程式行。本節將說明必要的修補程式及已修正MC/ServiceGuard A.11.14版的瑕疵。

必要及建議的修補程式 — 11.0

下表列出在HP-UX 11.0上,MC/ServiceGuard A.11.14必要或建議的修補程式。毋需通知逕行變更該表。若需最新資訊,請洽詢您的HP支援工程師。修補程式可隨時替換或收回,因此在下載程式前,請先檢查該修補程式的狀態。

表 1-3 HP-UX 11.0的修補程式

修補程式日期說明
PHCO_21901000824s700_800 11.00 fuser(1M) 累積修補程式。

PHCO_24437

010627

s700_800 11.00 LVM命令累積修補程式。
─ 必要的,若是使用EMC Symmetrix。

PHCO_25174

001221

s700_800 11.00 sar(1M) 累積修補程式。
─ 此為必要的修補程式。

PHKL_13431

971209

s700_800 11.00磁區損壞訊息,緊急狀況;資料可能已損毀

PHKL_18543

990628

s700_800 11.00 PM/VM/UFS/async/scsi/io/DMAPI/JFS/perf 修補程式。
─ 必要的,若是使用JFS 檔案系統 。
─ 必要的,若是使用T600系統中的HSC FDDI卡。
─ 必要的,若是使用100 Base-T區域網路卡。

PHKL_18800

990625

s700_800 11.00 累積JFS修補程式 ─ 緊急狀況:dirty inval
─ 必要的,若是使用 JFS 檔案系統。

PHKL_21352

010403

s700_800 11.00 rtsched(1) 補強,IDS/90
─ 建議使用此修補程式,若系統上已安裝Praesidium IDS/9000產品。

PHKL_22986

010130

s700_800 11.00累積pstat修補程式。

PHKL_23939

010712

s700_800 11.00光纖通道大量儲存設備驅動程式修補程式。
─ 必要的,若是使用光纖通道大量儲存設備。

PHKL_24074

010731

s700_800 11.00 PCI 累積修補程式。

PHKL_25118

010924

s700_800 11.00 LVM 累積修補程式。─ 必要的,若是使用 PV 連結。─ 必要的,若是使用光纖通道大量儲存設備。

PHKL_25475

011022

s700_800 11.00 s700_800 11.00 PM 累積修補程式。

PHKL_25906

011213

s700_800 11.00 Probe, IDDS,PM,VM,PA-8700,asyncio,T600,FS

PHKL_25938

011220

s700_800 11.00 SCSI IO子系統累積修補程式。

PHNE_15537

981007

s700_800 11.00 光纖通道累積修補程式。
─ 必要的,若是使用光纖通道網路。

PHNE_17104

010621

s700_800 11.00 gated (1M) 修補程式。

PHNE_18635

990624

s700_800 11.00 HP自動連接埠聚合(Auto-Port Aggregation)修補程式 B.11.00.02 ─ 自動連接埠聚合需要。

PHNE_20874

000703

s700_800 11.00 PCI FDDI B.11.00.[01-03,05,08,11-13]修補程式。
─ 必要的,若是使用PCI FDDI 區域網路卡。

PHNE_21390

000718

s700_800 11.00 HSC FDDI B.11.00.0[0-7] 累積修補程式。
─ 必要的,若是使用HSC FDDI區域網路卡

PHNE_21731

001103

s700_800 11.00 r-commands 累積大量修補程式。

PHNE_22244

001218

s700_800 11.00 內建的PCI 100BASE-T修補程式。
─ 必要的,若是使用 A5838A combo 卡。
─ 必要的,若是使用內建的PCI 100BaseT連接埠。

PHNE_23768

010626

s700_800 11.00 EISA FDDI B.11.00.0[0-7]累積修補程式。
─ 必要的,若是使用EISA FDDI區域網路卡。

PHNE_24007

010611

s700_800 11.00 4埠PCI 100BASE-T累積修補程式。
─ 必要的,若是使用A5506B 4埠網路卡。

PHNE_24025

010612

s700_800 11.00 HP-PB FDDI (J2157B) 產品累積修補程式。
─ 必要的,若是使用HP-PB FDDI區域網路卡。

PHNE_24085

011130

s700_800 11.00 HyperFabric B.11.00.0[0-12] 累積修補程式。

PHNE_24307

011024

s700_800 11.00 1000Base-SX/T B.11.00.[02-11] 累積修補程式。
─ 必要的,若是使用具1000Base-SX (Gigabit乙太網路) 自動連接埠聚合。

PHNE_24308

010807

s700_800 11.00 APA累積修補程式。
─ 必要的,若是使用自動連接埠聚合。

PHNE_24392

010910

s700_800 11.00 PCI 100B(Tx/Fx) 累積修補程式。
─ 必要的,若是使用PCI 100 Base-T區域網路卡。

PHNE_24413

010724

s700_800 11.00 區域網路產品累積修補程式。

PHNE_24725

011213

s700_800 11.00 EISA 100BT 修補程式。
─ 必要的,若是使用 EISA 100Base-T 區域網路卡。

PHNE_25116

011101

s700_800 11.00 累積 STREAMS 修補程式。

PHNE_25423

011212

s700_800 11.00 累積 ARPA 傳輸修補程式。

PHSS_17496

990224

s700_800 11.00 Predictive C.11.0[0,a-m]累積修補程式。

PHSS_25447

011105

s700_800 11.00 X/Motif 32bit Runtime OCT2001周期性修補程式。

PHSS_26056

020503支援 150 個套件。支援線上增加 EMS 資源。

 

必要及建議的修補程式 — 11i

下表列出在HP-UX 11i上,MC/ServiceGuard A.11.14版必要或建議的修補程式。毋需通知逕行變更該表。若需最新資訊,請洽詢您的HP支援工程師。修補程式可隨時替換或收回,因此在下載程式前,請先檢查該修補程式的狀態。

表 1-4 HP-UX 11i的修補程式

修補程式日期說明
PHCO_25814011204s700_800 11.11 LVM Virtual Array支援
─ 必要的,若是使用 HP 虛擬陣列 (Virtual Array)。

PHCO_25870

020404s700_800 11.11 累積SAM修補程式。

PHKL_23626

010427

s700_800 11.11 光纖通道大量儲存設備裝置修補程式。
─ 必要的,若是使用光纖通道大量儲存設備裝置。

PHKL_23877

010416

s700_800 11.11 HP VXVM B.03.10.[56] DMP的範圍緊急狀況修正
─ 必要的,若是使用VxVM。

PHKL_24779

010824

s700_800 11.11 LVM累積修補程式。
─ 必要的,若是使用MirrorDisk/UX。

PHKL_25304

010927

s700_800 11.11 s700_800 11.11 Preemption、VM allocation、Psets、MRG paging ─ 所有的ServiceGuard叢集均需要此修補程式。

PHKL_25869

011210

s700_800 11.11 修正SD時脈同步、負微秒修正。
─ 所有的ServiceGuard叢集均需要此修補程式。

PHKL_25896

011221

s700_800 11.11 SCSI IO 子系統累積修補程式。
─ 必要的,若是使用 VxVM。

PHNE_22727

010207

s700_800 11.11 100BT 統一的驅動程式累積修補程式。
─ 必要的,若是使用A5838A combo卡。
─ 必要的,若是使用 A5506B網路卡。
─ 必要的,若是使用內建的PCI 100BaseT連接埠。

PHNE_23465

020130100BT 統一的驅動程式累積修補程式。為 VLAN 必要的,若是使用100 Base T 網路卡。

PHNE_24130

010831

s700_800 11.11 inetd(1M) 累積修補程式。所有叢集均需要它。

PHNE_24309

010810

s700_800 11.11 APA B.11.11.00累積修補程式。
─ 自動連接埠聚合需要。

PHNE_24473

020226nettl(1M)、netfmt(1M),與 nettladm(1M) 修補程式。建議 VLAN 使用。

PHNE_24491

0201301000Base-SX/T B.11.11.[14] 累積修補程式。為 VLAN 必要的,若是使用 1 Gigabit 網路卡。

PHNE_25084

011101s700_800 11.11 累積STREAMS修補程式。

PHNE_25388

020130

LAN產品累積修補程式。為 VLAN 必要的。

PHNE_25642

011211

s700_800 11.11 累積 ARPA 傳輸修補程式。

PHSS_26056

020503支援 150 個套件。支援線上增加 EMS 資源。

 

修正

MC/ServiceGuard A.11.14版已修正下列瑕疵:

瑕疵編號 

問題與解決方案

SR 8606198063
(JAGad672542)
  

問題:當ServiceGuard協調(coordinator)節點無法擷取所有在叢集執行的套件子網路之狀態、cmsnmpd 與 cmcld失去關連,和停止更新與維護 ServiceGuard MIB時,cmsnmpd 子代理程式仍會維持作用,但是 EMS HA 監督程式及ClusterView 無法擷取目前的 ServiceGuard 套件和服務程式的狀態。使用者會在cmsnmpd 日誌檔 /var/adm/SGsnmpsuba.log中看到下列的錯誤訊息:

***Error:  reading status of SUBNET XX.XX.XX.XX

解決方案: 叢集 snmp 子代理程式 (cmsnmpd) 已修改為能正確地處理在叢集內所有的節點上不存在套件子網路的問題。

SR 8606199378
(JAGad68565)
  

問題:當cmsnmpd 子代理程式啟動,或是當本機節點或叢集關閉時產生某些ServiceGuard事件時,則snmpd代理程式會在 /var/adm/snmpd.log 檔案內登錄 "CloneVarBind: Unable to clone vb->value.os_value” 訊息。

解決方案:程式碼已修改為cmsnmpd子代理程式能正確地初始叢集相關的變數,如此便不會再發生錯誤。

SR 860620735
(JAGad76208)
  

問題:當ContinentalClusters 客戶在執行ContinentalClusters 命令時,若節點中止,則命令便會產生堆疊追蹤而失效。

解決方案:程式碼已修改為命令會回報正確的資訊,而非失效。

SR 8606209075, SR 8606222969
(JAGad78262, JAGad92075)
  

問題:在某些節點上有額外的子網路 (但其他的節點上則無) 時,cmquerycl命令逾時並失效。出現如下所示的訊息: Error: Unable to establish communication to node <nodename>. Failed to gather configuration information. 此外,其他的ServiceGuard命令(例如 cmviewcl 和 cmhaltpkg)會延遲 10 秒。

解決方案:程式碼已修改為利用INADDR_ANY僅送出一次 UDP探測,以確認節點間的路徑是正確的。

SR 8606212693
(JAGad81880)
  

問題:在套件ASCII配置檔中,以下列的設定值來配置套件的自動故障轉回失效:

FAILBACK_POLICY AUTOMATIC
STORAGE_GROUP VxVMdg

其中,VxVMdg是CVM磁碟群組。 以FAILBACK_POLICY AUTOMATIC 配置的套件,在節點重回叢集時應該移回主要的節點。但在此情況時則否。

解決方案:已增加檢查 AUTO_FAILBACK,現已修正程式碼中的上述行為。

SR 8606214965
(JAGad84157)
  

問題:新增節點至叢集時, cmapplyconf 命令得到一個如下所示的內部錯誤訊息: Internal error: Got unexpected generic_ack with no error number from cmclcofnd on <nodename>.
Error: Unable to retrieve configuration file from node <nodename>: Error 0
cmapplyconf : Unable to apply the configuration.

解決方案:程式碼已修改為在新增節點至叢集時, cmapplyconf 命令會成功。

SR 8606215621
(JAGad84805)
  

問題:若停用磁帶保留/釋出 (reserved release)功能的核心可調整參數時,需要能確保不能使用ServiceGuard共用的磁帶功能之機制。

解決方案:已在共用的磁帶協助程式 cmtaped 中增加檢查,此舉會在停用節點上的可調整核心參數 st_ats_enable時,它會將節點視為無 ATS 磁帶裝置。亦增加 ATS 配置命令中的檢查,以便當叢集中有一或多個節點停用核心可調整參數時,阻隔 ServiceGuard共用的磁帶配置。

SR 8606220905
(JAGad90041)
  

問題:cmcld協助程式會因核心延遲時間( latency)問題,而登錄 "timers delayed x.x seconds" (計時器延遲x.x秒) 訊息。ServiceGuard叢集若有兩個以上的節點沒有叢集鎖定,則在因這類延遲時間問題所導致的長時間核心懸置後,可能會重組為兩個叢集。遇長時間核心懸置的節點會在叢集中的其他節點組成另一個叢集時,組成單節點叢集。

解決方案:程式碼已修改並修正一個邏輯錯誤,並在叢集重組的後半已加入一些程式邏輯後,能確保節點無法從一個有三節點以上的叢集,組成另一個叢集。

SR 8606221218
(JAGad90352)
  

問題:若所有的心跳網路有嚴重的網路壅塞或是在極短的時間內任何一個節點上的cmcld協助程式經常發生核心(kernel)懸置時,便能將具雙節點有一個叢集鎖定的ServiceGuard叢集重組為兩個叢集。

解決方案:新增一修正程式,以確保不會錯誤地解除叢集鎖定。此外,會在叢集重組的後半時加入一些程式邏輯以確保叢集鎖定仍在。

SR 8606221920
(JAGad91038)
  

問題:當找不到 .rhost 和 cmclnodelist檔案,或是不當地設定時,ServiceGuard命令cmquerycl或cmviewcl不再列印錯誤訊息 "Permission denied to X";其中,X是節點的IP 位址。而是命令錯誤地列印錯誤訊息,例如: "Error: Unable to establish communication to node Y"。

解決方案:訊息的日誌層級已改為預設層級,如此使用者便能看到訊息。

SR 8606222631
(JAGad91744)
  

問題:即使網路配置中有浭on-uniform connection detected” ( 偵測到無一致的連接)的錯誤,ServiceGuard 命令 cmapplyconf 仍能執行。

解決方案:程式碼已修改為當偵測到網路問題時,命令即結束。

SR 8606223632
(JAGad92729)
  

問題:有序列連結的 ServiceGuard叢集會在所有的心跳網路轉接器故障時失效;當所有的心跳均使用跨接(crossover)纜線且其中一個節點失效時,它亦會失效。

解決方案:程式碼已修改為能正確地處理當所有心跳網路轉接器故障時的序列連結配置。

SR 8606224594
(JAGad93682)
  

問題: 在叢集至少被中止一次後,無法在同一節點上重新啟動配置多個 EMS資源的套件。

解決方案:程式碼已修改為能重新啟動配置多個 EMS資源的套件。

SR 8606224615
(JAGad93703)
  

問題:ServiceGuard管理員無法中止Linux叢集。

解決方案:程式碼已修改為能成功地中止 Linux 叢集。

SR 8606225203
(JAGad94290)
  

問題:當資源名稱超過40個字元時,ServiceGuard 的 cmstartres 和cmstopres 命令失效,並產生"Resource name should not be longer than 1024 characters" 錯誤訊息。

解決方案:程式碼已修改為能正確的比較資源名稱與允許的最長長度。

SR 8606225932
(JAGad95005)
  

問題: 在極大的壓力測試(stress test) 下,cmcld的記憶體可能會在叢集組成後跳至 128K。

解決方案:程式碼已修改為能預先配置供cmcld作業所需的額外記憶體。

SR 8606226503
(JAGad95572)
  

問題:ServiceGuard 協助程式 /usr/lbin/cmcld 將異常結束,並有核心傾印到 /var/adm/cmcluster/core。狀況會在核心中包括各種不同的異常結束訊息,和各種不同的堆疊追蹤(stack trace)。在syslog中沒有一個一致的訊息模式能預測此情況。通常失效會在進行「事件監視服務程式」時發生。然而,它常為無法解釋的區段違規(segment violation)。使用cmapplyconf或是使用資源的套件有時會導致此問題。

解決方案:程式碼已修改為能正確地執行記憶體「釋放」(free) 作業,如此便不會再發生異常結束的情形。

SR 8606226894
(JAGad95956)
  

問題:配置為使用跨多個容體群組檔案系統的套件,在故障轉移時耗時過久。

解決方案:已更新的套件控制命令集樣本讓您能指定並行容體群組啟用或停用的數量、fsck命令,及檔案系統裝載或卸載。預設是設定為舊的模式,即是將這些操作順序排列。

SR 8606229487
(JAGad98539)
  

問題:當ServiceGuard被告知有一個資源的值已改變時,若僅有其中一個RESOURCE_UP_VALUE準則未符,它便會認定該資源已關閉 (down),並讓套件失效。

解決方案:當資源改變值時,程式碼便藉由至少檢查是否符合其中一個準則來判斷資源的狀態;若仍認為資源是作用中時,便會讓套件繼續執行。

SR 8606231088
(JAGade00326)
  

問題:需要當子網路故障並隨即回復時,卻使得套件重新啟動而不是故障轉移之相關文件敘述。

解決方案:下次更新《《管理MC/ServiceGuard》 》和 《以ServiceGuard OPS Edition規劃OPS叢集》手冊時將包括下列的聲明:

「附註:套件若相依在子網路上,且在主要節點上的子網路故障,則套件即將關閉。若子網路隨即回復 (於套件子在承接節點上重新啟動之前),則套件便可能在主要節點上重新啟動。因而在此情況時,套件便不會切換到叢集內的另一個節點。」

已知的問題與解決方案

SR 8606114618 (JAGac29381):部份run命令集退出值導致ServiceGuard記錄不正確的錯誤訊息

  • 問題為何?如果套件run/halt命令集的退出值為7、13或19,則套件管理程式便不會正確地解譯錯誤訊息。

  • 如何解決?命令集中勿使用這些退出值。

SR 8606114619 (JAGac29382):套件管理程式不接受套件halt命令集的RESTART退出值

  • 問題為何?套件halt命令集若以RESTART(2)退出,於停止後,套件便不會重新啟動。

  • 如何解決?利用cmmodpkg -e pkgname命令以手動啟動套件。

SR 8606174686 (JAGad43932):ServiceGuard的修補程式若安裝在運行中的叢集上,便無法正確地運作

  • 問題為何?若在叢集運行時安裝修補程式,便無法如預期般地運作修正後的ServiceGuard。

  • 如何解決? 請遵循修補程式所提供的安裝說明,說明如下:

    1. 停止欲安裝修補程式之節點的ServiceGuard。

    2. 在該節點上安裝修補程式。

    3. 在該節點上重新啟動ServiceGuard。

    4. 必須在叢集的所有節點上安裝修補程式。

    5. 安裝時,ServiceGuard的snmp子代理程式會中止,而且不會自動重新啟動。此子代理程式主要用於ClusterView產品。若發生此情形,請執行下列命令以手動重新啟動該子代理程式:

      # /usr/lbin/cmsnmpagt start

SR 8606183590 (JAGad52803):cmmakepkg的線上援助頁未說明NODE_NAME可能會有「*」作為系統多節點套件的值

  • 問題為何? cmmakepkg的線上援助頁未說明「*」為NODE_NAME欄的有效值,且僅適用於系統多節點套件(亦即CVM套件VxVM-CVM-pkg)。

  • 如何解決?下列為套件ascii檔中, NODE_NAME欄正確的線上援助頁資訊:

    NODE_NAME

    可執行套件的節點名稱。此名稱必須符合叢集配置中的名稱。您可指定多個NODE_NAME項目。第一個NODE_NAME是主節點,隨後指定的節點會視為其他節點。特殊情況下,可使用「*」指定在所有節點上執行欲配置的套件。目前,僅支援「*」用於特殊CVM套件VxVM-CVM-pkg。

SR 8606184097 (JAGad53307):傳回cmrunpkg命令後,系統多節點套件立刻進入「啟動」狀態

  • 問題為何? 系統多節點套件的 cmrunpkg並未等候套件在所有節點上完成啟動。在套件啟動後,該命令立刻傳回,並未等候所有節點的套件皆已啟動,且套件狀態變更為「執行中」。

  • 如何解決?待數秒鐘,讓系統多節點套件在所有節點上完成啟動,再利用 cmviewcl檢查「執行中」狀態。

SR 8606185685 (JAGad54887):探測停用磁碟時,cmquerycl命令可能沒有反應

  • 問題為何?如果探測磁碟的 ServiceGuard 命令,如 cmquerycl 遇到停用的磁碟,該命令可能會沒有反應。

  • 如何解決?如果整個磁碟配置(LUN數目)不大,請等候該命令完成,否則請用CTRL-C中斷命令。

SR 8606194924 (JAGad64130):對60個具有大量服務的套件執行cmviewcl時,cmcld會佔據50%的CPU

  • 問題為何?具有大量套件和服務的叢集在執行cmviewcl -v 時,cmcld 會佔據50%的CPU,直到完成命令為止。

  • 如何解決?縮減cmviewcl命令的範圍。例如僅對特定套件下達命令。

SR 8606202196 (JAGad71370):cmhaltpkg時,有問題的命令集印出不正確的錯誤訊息

  • 問題為何?執行cmhaltpkg時,如果套件控制命令集有問題(檔案不存在、無執行使用權等),終端機上會列出下列錯誤訊息:

    Unknown error returned from daemon: Error 0

  • 如何解決?檢查控制命令集是否存在且是否正確設定檔案使用權。

SR 8606224994 (JAGad94082):cmcld在叢集重組後異常結束

  • 問題為何?有兩個以上節點且具備雙心跳網路的ServiceGuard叢集,若其中一個心跳網路斷線一段時間 (超過 tcp_ip_abort_interval),接著回復且在稍後另一個心跳網路故障時,叢集可能會失效。叢集會重組並隨即再失效,且會在 syslog 中列有如下列所示的訊息:

    Node if 3 did not reach sync step 0 for activity 3 within timeout.  This activity apppears to be hung at step -1 on that node, so node will be killed.

    Attempting to kill node <node_name>

    Reason: This node did not reach sync step 0 for activity 3 within timeout
  • 如何解決? 尚無解決的辦法。

SR 8606233054 (JAGae02278):無法在昇級後新增套件

  • 問題為何? 若將具備EMS資源的套件,新增至執行A.11.12版或舊版的叢集,且套件被刪除,叢集並於稍後昇級至 A.11.14版,則在線上新增任何套件時可能會失敗。cmapplyconf 命令可能會送回如下所列的錯誤訊息:

    Error: Unable to apply the configuration change
     Unknown error: 3015.
    Check the syslog file(s) for additional information.
    cmapplyconf: Unable to apply the configuration

    syslog檔案可能會包括如下所示的錯誤訊息:

    cmcld: cdb_db_prepare - 3015 error occured 5
  • 如何解決? 若能取得修補程式 PHSS_26056,請安裝它;否則可電詢HP 支援人員以取得一個暫時的修補程式。

可列印版本
隱私權聲明 使用範圍與著作權聲明
© Hewlett-Packard Development Company, L.P.