回到網頁內容 臺灣-繁體中文
HP.com 首頁 產品資訊 支�#169;及驅動程式 解決方案 如何購買
» 聯絡 HP
進階選項
HP.com 首頁
ServiceGuard OPS Edition A.11.14版版本需知 第二版 > 第 1 章. ServiceGuard OPS Edition A.11.14版版本需知 第二版

版本的修補程式和修正程式

» 

技術文件

PDF 格式的完整書籍
» 回饋意見
內容©韟像B開©l

 » 目錄

A.11.13版內已併入ServiceGuard OPS Edition A.11.01版到A.11.12版的內容,包括 A.11.09版和A.11.12版的修補程式行。本節將說明必要的修補程式及已修正ServiceGuard OPS Edition A.11.14版的瑕疵。

必要及建議的修補程式 — 11.0

下表列出在HP-UX 11.0上,ServiceGuard OPS Edition A.11.14必要或建議的修補程式。毋需通知逕行變更該表。若需最新資訊,請洽詢您的HP支援工程師。修補程式可隨時替換或收回,因此在下載程式前,請先檢查該修補程式的狀態。

表 1-2 HP-UX 11.0的修補程式

修補程式日期說明
PHCO_21901000824s700_800 11.00 fuser(1M) 累積修補程式

PHCO_24437

010627

s700_800 11.00 LVM 命令累積修補程式 ─ 必要的,若是使用EMC Symmetrix。

PHCO_25174

011221

s700_800 11.00 sar(1M) 累積修補程式 ─ 此為必要的修補程式。

PHKL_13431

971209

s700_800 11.00 磁區損壞訊息,緊急狀況;資料可能已損毀

PHKL_18543

990628

s700_800 11.00 PM/VM/UFS/async/scsi/io/DMAPI/JFS/perf修補程式。─ 必要的,若是使用JFS 檔案系統 。─ 必要的,若是使用T600系統中的HSC FDDI卡。 ─ 必要的,若是使用100 Base-T區域網路卡。

PHKL_18800

990625

s700_800 11.00 累積JFS修補程式 ─ 緊急狀況:dirty inval
─ 必要的,若是使用 JFS 檔案系統。

PHKL_21352

010403

s700_800 11.00 rtsched(1) 補強,IDS/90
─ 建議使用此修補程式,若系統上已安裝Praesidium IDS/9000產品。

PHKL_22986

010130

s700_800 11.00累積pstat修補程式。

PHKL_23939

010712

s700_800 11.00 光纖通道大量儲存設備裝置驅動程式修補程式。─ 必要的,若是使用光纖通道大量儲存設備。

PHKL_24074

010731

s700_800 11.00 PCI 累積修補程式。

PHKL_25118

010924

s700_800 11.00 LVM 累積修補程式。─ 必要的,若是使用 PV連結。─ 必要的,若是使用光纖通道大量儲存設備。

PHKL_25475

011022

s700_800 11.00 s700_800 11.00 PM 累積修補程式。

PHKL_25906

011213

s700_800 11.00 Probe, IDDS,PM,VM,PA-8700,asyncio,T600,FS

PHKL_25938

011220

s700_800 11.00 SCSI IO 子系統累積修補程式

PHNE_15537

981007

s700_800 11.00 光纖通道累積修補程式
─ 必要的,若是使用光纖通道網路。

PHNE_17104

010621

s700_800 11.00 gated (1M) 修補程式。

PHNE_18635

990624

s700_800 11.00 HP 自動連接埠聚合(Auto-Port Aggregation)修補程式 B.11.00.02。─ 自動連接埠聚合需要。

PHNE_20874

000703

s700_800 11.00 PCI FDDI B.11.00.[01-03,05,08,11-13] 修補程式。
─ 必要的,若是使用 PCI FDDI 區域網路卡。

PHNE_21390

000718

s700_800 11.00 HSC FDDI B.11.00.0[0-7] 累積修補程式
─ 必要的,若是使用 HSC FDDI區域網路卡。

PHNE_21731

001103

s700_800 11.00 r-commands累積大量修補程式。

PHNE_22244

001218

s700_800 11.00 內建PCI 100BASE-T 修補程式。
─ 必要的,若是使用 A5838A combo 卡。
─ 必要的,若是使用內建的PCI 100BaseT連接埠。

PHNE_23768

010626

s700_800 11.00 EISA FDDI B.11.00.0[0-7] 累積修補程式
─ 必要的,若是使用 EISA FDDI 區域網路卡。

PHNE_24007

010611

s700_800 11.00 4 連接埠PCI 100BASE-T 累積修補程式
─ 必要的,若是使用 A5506B 4 連接埠網路卡。

PHNE_24025

010612

s700_800 11.00 HP-PB FDDI (J2157B) 產品累積修補程式
─ 必要的,若是使用HP-PB FDDI區域網路卡。

PHNE_24085

011130

s700_800 11.00 HyperFabric B.11.00.0[0-12] 累積修補程式

PHNE_24307

011024

s700_800 11.00 1000Base-SX/T B.11.00.[02-11] 累積修補程式
─ 必要的,若是使用具有 1000Base-SX (Gigabit乙太網路)的自動連接埠聚合。

PHNE_24308

010807

s700_800 11.00 APA 累積修補程式
─ 必要的,若是使用自動連接埠聚合。

PHNE_24392

010910

s700_800 11.00 PCI 100B(Tx/Fx) 累積修補程式。
─ 必要的,若是使用 PCI 100 Base-T 區域網路卡。

PHNE_24413

010724

s700_800 11.00 LAN 產品累積修補程式

PHNE_24725

011213

s700_800 11.00 EISA 100BT 修補程式
─ 必要的,若是使用EISA 100Base-T區域網路卡。

PHNE_25116

011101

s700_800 11.00 累積 STREAMS 修補程式

PHNE_25423

011212

s700_800 11.00 累積ARPA 傳輸修補程式

PHSS_17496

990224

s700_800 11.00 Predictive C.11.0[0,a-m] 累積修補程式

PHSS_25447

011105

s700_800 11.00 X/Motif 32bit Runtime OCT2001 周期性修補程式

PHSS_26056

020503支援 150 個套件。支援線上增加 EMS 資源。

 

必要及建議的修補程式 — 11i

下表列出在HP-UX 11i上,ServiceGuard OPS Edition A.11.14版必要或建議的修補程式。毋需通知逕行變更該表。若需最新資訊,請洽詢您的HP支援工程師。修補程式可隨時替換或收回,因此在下載程式前,請先檢查該修補程式的狀態。

表 1-3 HP-UX 11i的修補程式

修補程式日期說明
PHCO_25814011204s700_800 11.11 LVM Virtual Array 支援
─ 必要的,若是使用 HP虛擬陣列(Virtual Array)。

PHCO_25870

020404s700_800 11.11 累積SAM修補程式。

PHKL_23626

010427

s700_800 11.11 光纖通道大量儲存設備修補程式。
─ 必要的,若是使用光纖通道大量儲存設備。

PHKL_23877

010416

s700_800 11.11 HP VXVM B.03.10.[56] DMP的範圍緊急狀況修正。─ 必要的,若是使用VxVM。

PHKL_24779

010824

s700_800 11.11 LVM 累積修補程式。必要的,若是使用 MirrorDisk/UX。

PHKL_25304

010927

s700_800 11.11 s700_800 11.11 Preemption, VM allocation, Psets, MRG paging ─ 所有ServiceGuard叢集均需要此修補程式。

PHKL_25869

011210

s700_800 11.11 修正SD時脈同步、負微秒修正
─ 所有ServiceGuard叢集均需要此修補程式。

PHKL_25896

011221

s700_800 11.11 SCSI IO 子系統累積修補程式。
─ 必要的,若是使用VxVM。

PHNE_22727

010207

s700_800 11.11 100BT 統一的驅動程式累積修補程式 ─ 必要的,若是使用A5838A combo 卡。 ─ 必要的,若是使用A5506B 網路卡。─ 必要的,若是使用內建的 PCI 100BaseT 連接埠。

PHNE_23465

020130100BT 統一的驅動程式累積修補程式。為 VLAN 必要的 ,若是使用100 Base T 網路卡。

PHSS_24304

011101

s700_800 11.11 ld(1) 和連結器(linker)工具累積修補程式 ─ 必要的,若是使用Oracle 9i。

PHNE_24130

010831

s700_800 11.11 inetd(1M) 累積修補程式。所有叢集均需要它。

PHNE_24309

010810

s700_800 11.11 APA B.11.11.00 累積修補程式
─ 自動連接埠聚合需要。

PHNE_24491

0201301000Base-SX/T B.11.11.[14] 累積修補程式。為 VLAN 必要的,若是使用 1 Gigabit 網路卡。

PHNE_24473

020226nettl(1M)、netfmt(1M),與 nettladm(1M) 修補程式。建議 VLAN 使用。

PHNE_25084

011101s700_800 11.11 累積STREAMS修補程式。

PHNE_25388

020130

LAN產品累積修補程式。為 VLAN 必要的。

PHNE_25642

011211

s700_800 11.11 累積 ARPA 傳輸修補程式

PHSS_26056

020503支援 150 個套件。支援線上增加 EMS 資源。

 

修正

ServiceGuard OPS Edition A.11.14已修正下列瑕疵:

瑕疵編號 

問題與解決方案

SR 8606198063
(JAGad672542)
  

問題:當ServiceGuard協調(coordinator)節點無法擷取所有在叢集執行的套件子網路之狀態、cmsnmpd 與 cmcld失去關連,和停止更新與維護 ServiceGuard MIB時,cmsnmpd 子代理程式仍會維持作用,但是 EMS HA 監督程式及ClusterView 無法擷取目前的 ServiceGuard 套件和服務程式的狀態。使用者會在cmsnmpd 日誌檔 /var/adm/SGsnmpsuba.log中看到下列的錯誤訊息:

***Error:  reading status of SUBNET XX.XX.XX.XX

解決方案: 叢集 snmp 子代理程式 (cmsnmpd) 已修改為能正確地處理在叢集內所有的節點上不存在套件子網路的問題。

SR 8606199378
(JAGad68565)
  

問題:cmsnmpd 子代理程式啟動,或是當本機節點或叢集關閉時產生某些ServiceGuard事件時,則snmpd代理程式會在/var/adm/snmpd.log檔案內登錄 毧loneVarBind: Unable to clone vb->value.os_value” 訊息。

解決方案:程式碼已修改為cmsnmpd子代理程式能正確地初始叢集相關的變數,如此便不會再發生錯誤。

SR 860620735
(JAGad76208)
  

問題:當ContinentalClusters 客戶在執行ContinentalClusters 命令時,若節點中止,則命令便會產生堆疊追蹤而失效。

解決方案:程式碼已修改為命令會回報正確的資訊,而非失效。

SR 8606207880
(JAGad77057)
  

問題:cmgmsd 抱怨有太多開啟的檔案。在啟動和停止Oracle OPS後,發現 tcp 連接要達到最高 tcp 資源或是直到叢集中止後才會結束。

解決方案:當OPS關閉且應用例離開群組後,確認是否已關閉socket檔案敘述明細(descriptor);此舉將確保 TCP亦會相應地關閉。

SR 8606208631
(JAGad77818)
  

問題:即使SLVM容體群組是以專用模式啟用,仍無法線上配置節點。通常線上節點配置僅會在容體群組標示為叢集查覺、可共用和已共用的模式啟用時才會失效。在此狀況下,即使容體群組標示為叢集查覺、可共用和以專用模式啟用,仍無法線上配置節點。這是因為無法分辨標示為叢集查覺、可共用SLVM容體模組的啟用模式。

解決方案:無足夠的欄位來表示以專用模式啟用的SLVM容體群組,因此會將它表示為是以共用模式啟用。我們已新增欄位和邏輯來表示這些不同啟用的模式。

SR 8606208641
(JAGad77828)
  

問題:在允許線上節點配置之前,cmapplyconf命令僅會在本機節點上檢查以共用模式啟用的SLVM容體模組。但必須檢查是否在所有的節點上有任何是以共用模式啟用的容體模組。

解決方案:在線上節點配置期間,我們檢查是否有任何是以共用模式啟用的 SLVM容體群組;並判斷是否要允許線上節點配置。

SR 8606209075, SR 8606222969
(JAGad78262, JAGad92075)
  

問題:在某些節點上有額外的子網路 (但其他的節點上則無) 時,cmquerycl命令逾時並失效。出現如下所示的訊息: Error: Unable to establish communication to node <nodename>. Failed to gather configuration information.

此外,其他的ServiceGuard命令(例如cmviewclcmhaltpkg)會延遲10 秒。

解決方案:程式碼已修改為利用INADDR_ANY僅送出一次 UDP探測,以確認節點間的路徑是正確的。

SR 8606212693
(JAGad81880)
  

問題:在套件ASCII配置檔中,以下列的設定值來配置套件的自動故障轉回失效:

FAILBACK_POLICY AUTOMATIC
STORAGE_GROUP VxVMdg

其中,VxVMdg是CVM磁碟群組。 以FAILBACK_POLICY AUTOMATIC 配置的套件,在節點重回叢集時應該移回主要的節點。但在此情況時則否。

解決方案:已增加檢查 AUTO_FAILBACK,現已修正程式碼中的上述行為。

SR 8606214965
(JAGad84157)
  

問題:新增節點至叢集時, cmapplyconf 命令得到一個如下所示的內部錯誤訊息: Internal error: Got unexpected generic_ack with no error number from cmclcofnd on <nodename>.
Error: Unable to retrieve configuration file from node <nodename>: Error 0
cmapplyconf : Unable to apply the configuration.

解決方案:程式碼已修改為在新增節點至叢集時, cmapplyconf 命令會成功。

SR 8606215621
(JAGad84805)
  

問題:若停用磁帶保留/釋出 (reserved / release) 功能的核心可調整參數時,需要能確保不能使用ServiceGuard共用的磁帶功能之機制。

解決方案:已在共用的磁帶協助程式 cmtaped 中增加檢查,此舉會在停用節點上的可調整核心參數 st_ats_enable時,它會將節點視為無 ATS 磁帶裝置。亦增加 ATS 配置命令中的檢查,以便當叢集中有一或多個節點停用核心可調整參數時,阻隔 ServiceGuard共用的磁帶配置。

SR 8606220905
(JAGad90041)
  

問題:cmcld協助程式會因核心延遲時間( latency)問題,而登錄 烠imers delayed x.x seconds”(計時器延遲x.x秒) 訊息。ServiceGuard叢集若有兩個以上的節點沒有叢集鎖定,則在因這類延遲時間問題所導致的長時間核心懸置後,可能會重組為兩個叢集。遇長時間核心懸置的節點會在叢集中的其他節點組成另一個叢集時,組成單節點叢集。

解決方案:程式碼已修改並修正一個邏輯錯誤,並在叢集重組的後半已加入一些程式邏輯後,能確保節點無法從一個三節點以上的叢集,組成另一個叢集。

SR 8606221218
(JAGad90352)
  

問題:若所有的心跳網路有嚴重的網路壅塞或是在極短的時間內任何一個節點上的cmcld協助程式經常發生核心(kernel)懸置 時,便能將具雙節點有一個叢集鎖定的ServiceGuard叢集重組為兩個叢集。

解決方案:新增一修正程式,以確保不會錯誤地解除叢集鎖定。此外,會在叢集重組的後半時加入一些程式邏輯以確保叢集鎖定仍在。

SR 8606221920
(JAGad91038)
  

問題:當找不到 .rhost 和 cmclnodelist檔案,或是不當地設定時,ServiceGuard命令cmquerycl或cmviewcl不再列印錯誤訊息 涑ermission denied to X荂F其中,X是節點的IP 位址。而是命令錯誤地列印錯誤訊息,例如: 浺rror: Unable to establish communication to node Y荂C

解決方案:訊息的日誌層級已改為預設層級,如此使用者便能看到訊息。

SR 8606222631
(JAGad91744)
  

問題:即使網路配置中有浭on-uniform connection detected” ( 偵測到無一致的連接)的錯誤,ServiceGuard 命令 cmapplyconf 仍能執行。

解決方案:程式碼已修改為當偵測到網路問題時,命令即結束。

SR 8606223632
(JAGad92729)
  

問題:有序列連結的 ServiceGuard叢集會在所有的心跳網路轉接器故障時失效;當所有的心跳均使用跨接(crossover)纜線且其中一個節點失效時,它亦會失效。

解決方案:程式碼已修改為能正確地處理當所有心跳網路轉接器故障時的序列連結配置。

SR 8606224594
(JAGad93682)
  

問題: 在叢集至少被中止一次後,無法在同一節點上重新啟動配置多個 EMS資源的套件。

解決方案:程式碼已修改為能重新啟動配置多個 EMS資源的套件。

SR 8606224615
(JAGad93703)
  

問題:ServiceGuard管理員無法中止Linux叢集。

解決方案:程式碼已修改為能成功地中止 Linux 叢集。

SR 8606225203
(JAGad94290)
  

問題:當資源名稱超過40個字元時,ServiceGuard 的 cmstartres 和cmstopres 命令失效,並產生 淯esource name should not be longer than 1024 characters” 錯誤訊息。

解決方案:程式碼已修改為能正確的比較資源名稱與允許的最長長度。

SR 8606225932
(JAGad95005)
  

問題: 在極大的壓力測試(stress test) 下,cmcld的記憶體可能會在叢集組成後跳至 128K。

解決方案:程式碼已修改為能預先配置供cmcld作業所需的額外記憶體。

SR 8606226503
(JAGad95572)
  

問題:ServiceGuard 協助程式 /usr/lbin/cmcld 將異常結束,並有核心傾印到 /var/adm/cmcluster/core。狀況會在核心中包括各種不同的異常結束訊息,和各種不同的堆疊追蹤(stack trace)。在syslog中沒有一個一致的訊息模式能預測此情況。通常失效會在進行「事件監視服務程式」時發生。然而,它常為無法解釋的區段違規(segment violation)。使用cmapplyconf或是使用資源的套件有時會導致此問題。

解決方案:程式碼已修改為能正確地執行記憶體「釋放」(free) 作業,如此便不會再發生異常結束的情形。

SR 8606226894
(JAGad95956)
  

問題:配置為使用跨多個容體群組檔案系統的套件,在故障轉移時耗時過久。

解決方案:已更新的套件控制命令集樣本讓您能指定並行容體群組啟用或停用的數量、fsck命令,及檔案系統裝載或卸載。預設是設定為舊的模式,即是將這些操作順序排列。

SR 8606229487
(JAGad98539)
  

問題:當ServiceGuard被告知有一個資源的值已改變時,若僅有其中一個RESOURCE_UP_VALUE準則未符,它便會認定該資源已關閉 (down),並讓套件失效。

解決方案:當資源改變值時,程式碼便藉由至少檢查是否符合其中一個準則來判斷資源的狀態;若仍認為資源是作用中時,便會讓套件繼續執行。

SR 8606231088
(JAGae00326)
  

問題:需要當子網路故障並隨即回復時,卻使得套件重新啟動而不是故障轉移之相關文件敘述。

解決方案:下次更新《《管理MC/ServiceGuard》 》和 《以ServiceGuard OPS Edition規劃OPS叢集》手冊時,於次版中將包括下列的聲明:

「附註:套件若相依在子網路上,且在主要節點上的子網路故障,則套件即將關閉。若子網路隨即回復 (於套件子在承接節點上重新啟動之前),則套件便可能在主要節點上重新啟動。因而在此情況時,套件便不會切換到叢集內的另一個節點。」

已知的問題與解決方案

SR 4701363812: View動作在SAM顯示的資訊比cmviewcl命令少

  • 問題為何?在Package Configuration和Package Administration子區域中,View動作不會顯示套件子網路及子網路狀態的資訊。

  • 如何解決?將顯示變更為Cluster Administration子區域。

SR 4701365817:預設監測SAM中未選取的子網路

  • 問題為何? 在SAM中建立或修改叢集網路配置時,會配置未選取的子網路為監測的非心跳子網路。

  • 如何解決?編輯/etc/cmcluster/cmclconfig.ascii檔,移除未選取的子網路並使用cmapplyconf於編輯好的檔案上。

SR 4701365833:命令失敗,出現網路磁碟分區訊息

  • 問題為何? cmquerycl、cmcheckconf及cmapplyconf命令可能會因網路磁碟分區有問題而失敗。使用光纖通道網路時,特別容易發生此問題。訊息如下:

    cmcheckconf -v -C ascii_file
    Error: Unable to communicate with node arcus
    Error: Lost contact with arcus
    Error Detected a partition of IP subnet 192.6.145.0.
      Partition 1
         funnel lan0
       Partition 2
         vega lan5
       Partition 3
         rigel lan0
       Partition 4
         mizar lan0
    Error: Detected a partition of IP subnet 192.6.145.0
      Partition 1
         funnel lan5
       Partition 2
         vega lan7
       Partition 3
         rigel lan7
       Partition 4
         mizar lan5
    cmcheckconf   :   Unable to reconcile configuration file
  • 如何解決?重新輸入命令。若問題依然存在,請用lanscannetstat命令來確認叢集網路功能的狀態。解決網路功能問題後,請再試一次cmqueryclcmcheckconfcmapplyconf命令。

SR 4701377473:啟用容體群組時,磁碟關機

  • 問題為何?叢集內任一節點啟用磁碟的容體群組,若在此時關閉磁碟,則下列命令有可能會沒反應:cmqueryclcmapplyconfcmcheckconf。僅於失敗的磁碟上有未鏡射的邏輯容體時,才會發生沒有反應的情形。

  • 如何解決?有3種方法可避免此問題:

    • 修理磁碟或在下一次變更配置前先boot。

    • 如果容體群組有作業中的磁碟,在執行上述命令前,先停用該容體群組。請使用vgchange -a n命令。

    • 僅使用鏡射的邏輯容體。

SR 4701385617:允許無效的資源輪詢間隔

  • 問題為何?利用SAM可能可以配置無效的資源輪詢間隔 (polling interval)。

  • 如何解決? 請確認是否使用有效的資源輪詢間隔。請參閱SAM的援助說明畫面或cmmakepkg(1)的線上援助頁。此外,亦可使用cmcheckconfcmapplyconf命令而不要使用SAM來執行確認。

SR 4701385625:節點名稱不應包含網域名稱

  • 問題為何?安裝 HP-UX或執行/sbin/set_parms時,如果節點的主機名稱定義為完整的網域名稱,如maple.cup.hp.com,則cmquerycl命令會失敗。下例顯示當節點包含完整網域,試圖查詢節點maple時所顯示的訊息:

    # cmquerycl -n maple

    Begin checking the nodes...
    Looking for other clusters ... Done
    Gathering configuration information ........ Done
    Error: Unable to communicate with node maple
    Error: Unable to determine device configuration: failed to send device query to node maple
    Failed to gather configuration information..

  • 如何解決?使用/sbin/set_parms命令將節點的主機名稱設為僅限節點名稱,如maple

SR 4701395533:「啟動」套件時,cmhaltpkg未正確運作

  • 問題為何?套件若在「啟動」狀態時下達cmhaltpkg命令,該命令不一定會運作。

  • 如何解決?待套件完成啟動後,再下達cmhaltpkg命令。

SR 4701406223:如果系統時間往回設,套件命令便無反應

  • 問題為何?若利用Date (1M)命令將系統時間往回設,則ServiceGuard OPS Edition協助程式無法正確偵測套件控制命令集是否已完成。當時間趕上原來的時間後,才會完成套件命令。

  • 如何解決?不支援將系統時間往回設。

SR 8606114618 (JAGac29381):部份run命令集退出值導致ServiceGuard記錄不正確的錯誤訊息

  • 問題為何?如果套件run/halt命令集的退出值為7、13或19,則套件管理程式便不會正確地解譯錯誤訊息。

  • 如何解決?命令集中勿使用這些退出值。

SR 8606114619 (JAGac29382):套件管理程式不接受套件halt命令集的RESTART退出值

  • 問題為何?套件halt命令集若以RESTART(2)退出,於停止後,套件便不會重新啟動。

  • 如何解決?利用cmmodpkg -e pkgname命令以手動啟動套件。

SR 8606174686 (JAGad43932):ServiceGuard的修補程式若安裝在運行中的叢集上,便無法正確地運作

  • 問題為何?若在叢集運行時安裝修補程式,便無法如預期般地運作修正後的ServiceGuard。

  • 如何解決?請遵循修補程式所提供的安裝說明,說明如下:

    1. 停止欲安裝修補程式之節點的ServiceGuard。

    2. 在該節點上安裝修補程式。

    3. 在該節點上重新啟動ServiceGuard。

    4. 必須在叢集的所有節點上安裝修補程式。

    5. 安裝時,ServiceGuard的snmp子代理程式會中止,而且不會自動重新啟動。此子代理程式主要用於ClusterView產品。若發生此情形,請執行下列命令以手動重新啟動該子代理程式:

      # /usr/lbin/cmsnmpagt start

SR 8606183590 (JAGad52803):cmmakepkg的線上援助頁未說明NODE_NAME可能會有「*」作為系統多節點套件的值

  • 問題為何? cmmakepkg的線上援助頁未說明「*」為NODE_NAME欄的有效值,且僅適用於系統多節點套件(亦即CVM套件VxVM-CVM-pkg)。

  • 如何解決?下列為套件ascii檔中, NODE_NAME欄正確的線上援助頁資訊:

    NODE_NAME

    可執行套件的節點名稱。此名稱必須符合叢集配置中的名稱。您可指定多個NODE_NAME項目。第一個NODE_NAME是主節點,隨後指定的節點會視為其他節點。特殊情況下,可使用「*」指定在所有節點上執行欲配置的套件。目前,僅支援「*」用於特殊CVM套件VxVM-CVM-pkg。

SR 8606184097 (JAGad53307):傳回cmrunpkg命令後,系統多節點套件立刻進入「啟動」狀態

  • 問題為何? 系統多節點套件的 cmrunpkg並未等候套件在所有節點上完成啟動。在套件啟動後,該命令立刻傳回,並未等候所有節點的套件皆已啟動,且套件狀態變更為「執行中」。

  • 如何解決?待數秒鐘,讓系統多節點套件在所有節點上完成啟動,再利用 cmviewcl檢查「執行中」狀態。

SR 8606194924 (JAGad64130):對60個具有大量服務的套件執行cmviewcl時,cmcld會佔據50%的CPU

  • 問題為何?具有大量套件和服務的叢集在執行cmviewcl -v時cmcld會佔據50%的CPU,直到完成命令為止。

  • 如何解決?縮減cmviewcl命令的範圍。例如僅對特定套件下達命令。

SR 8606185685 (JAGad54887):探測停用磁碟時,cmquerycl命令可能沒有反應

  • 問題為何?如果探測磁碟的ServiceGuard命令,如cmquerycl遇到停用的磁碟,該命令可能會沒有反應。

  • 如何解決?如果整個磁碟配置(LUN數目)不大,請等候該命令完成,否則請用CTRL-C中斷命令。

SR 8606202196 (JAGad71370):cmhaltpkg時,有問題的命令集印出不正確的錯誤訊息

  • 問題為何?執行cmhaltpkg時,如果套件控制命令集有問題(檔案不存在、無執行使用權等),終端機上會列出下列錯誤訊息:

    Unknown error returned from daemon: Error 0

  • 如何解決?檢查控制命令集是否存在且是否正確設定檔案使用權。

SR 8606224994 (JAGad94082):cmcld在叢集重組後異常結束

  • 問題為何?有兩個以上節點且具備雙心跳網路的ServiceGuard叢集,若其中一個心跳網路斷線一段時間 (超過 tcp_ip_abort_interval),接著回復且在稍後另一個心跳網路故障時,叢集可能會失效。叢集能重組並隨即失效,且會在 syslog 中列有如下列所示的訊息:

    Node if 3 did not reach sync step 0 for activity 3 within timeout.  This activity apppears to be hung at step -1 on that node, so node will be killed.

    Attempting to kill node <node_name>

    Reason: This node did not reach sync step 0 for activity 3 within timeout
  • 如何解決? 尚無解決的辦法。

SR 8606233054 (JAGae02278):無法在昇級後新增套件

  • 問題為何? 若將具備EMS資源的套件,新增至執行A.11.12版或舊版的叢集,且套件被刪除,叢集並於稍後昇級至 A.11.14版,則在線上新增任何套件時可能會失敗。cmapplyconf 命令可能會送回如下所列的錯誤訊息:

    Error: Unable to apply the configuration change
     Unknown error: 3015.
    Check the syslog file(s) for additional information.
    cmapplyconf: Unable to apply the configuration

    syslog檔案可能會包括如下所示的錯誤訊息:

    cmcld: cdb_db_prepare - 3015 error occured 5
  • 如何解決? 若能取得修補程式 PHSS_26056,請安裝它;否則可電詢HP 支援人員以取得一個暫時的修補程式。

無法安裝OPS 8.1.5

  • 問題為何? 無法在ServiceGuard OPS Edition A.11.09上安裝 OPS 8.1.5 32位元。

  • 如何解決? 若昇級的版本為ServiceGuard OPS Edition A.11.08或更早的版本,請在安裝ServiceGuard OPS Edition A.11.09之前,先安裝OPS 8.1.5 32位元。本版發行時,Oracle正在研究此問題。若需修正資訊,請洽詢您的Oracle代表。

OPS 8.x 使用者無法清楚OPS配置應採用何種LAN進行通訊

  • 問題為何?在 OPS 8.x中,使用者無法清楚OPS配置應採用何種LAN進行通訊。OPS 8.x只會選取第一個gethostbyname()傳回的IP,需視DNS設定的方式而定。大部份的 OPS 叢集配置多個區域網路,並非所有區域網路都是高可用性的。若OPS採用非高可用性的區域網路在節點間進行通訊,則該區域網路便會單點失敗。萬一該區域網路失敗,OPS會無反應。

  • 如何解決?有一個簡單的解決方案是先確認叢集中所配置的區域網路皆為高可用性。另一個方法是將OPS會用來通訊的IP置於/etc/hosts檔中,並在DNS前配置系統進行/etc/hosts名稱解析。如此一來,使用者即可控制gethostbyname()的傳回值及OPS所使用的LAN IP。

SNMP 配置檔註解標示行

  • 問題為何?先前版本的SNMP 14.x軟體會註解標示get-community-name參數。舊版的配置檔可能仍會註解出此參數而使其失效。

  • 如何解決?編輯名為/etc/SnmpAgent.d/snmpd.conf的SNMP配置檔。取消get-community-name參數的註解標示,並設為public。該行應如下:

     get-community-name: public # enter community name

Boot/Root磁碟應使用高優先SCSI位址

  • 問題為何?boot/root磁碟配置為共用SCSI匯流排的低優先位址時,如果存取該boot/root 裝置逾時,系統可能會發生緊急狀況。同一個匯流排上配置多個節點及多個磁碟時,叢集可能會發生此情形。

  • 如何解決? 請確認依下列方法分配SCSI位址─叢集節點的介面卡具有最高優先的SCSI位址,接著是位於共用匯流排上的boot/root磁碟,最後是共用匯流排上的其他磁碟。

使用者程序的優先順序不應高於20

  • 問題為何? ServiceGuard OPS Edition叢集協助程式執行的優先順序為20。使用者程序執行的優先順序若高於叢集的協助程式,可能會對協助程式造成干擾。使用者的程序若具有較高的優先順序(小於20的數字),則叢集的協助程式可能無法更新安全計時器,因而導致節點失敗。

  • 如何解決?使用者程序分配的優先順序應較叢集的協助程式低(較大的數字),協助程式的優先順序為20。

不應同時執行cmhaltpkgcmhaltnode

  • 問題為何?如果同時執行cmhaltpkg和cmhaltnode,便會在套件待停止的時期會出現一個小的時間差,套件可能會重新啟動。

  • 如何解決? 請勿同時執行cmhaltpkgcmhaltnode

SAM中出現空白的「View All Clusters」畫面

  • 問題為何?只有當ServiceGuard OPS Edition無法取得任一叢集節點的配置檔時,SAM在cluster administration的子區域中,「View All Clusters」才會顯示空白畫面。此問題的影響不大,因為SAM不支援遠端叢集配置及管理作業。

  • 如何解決?

    1. 若要管理本機叢集,請選取「View Local Cluster」。

    2. 若要查看所有叢集的運行時間狀態資訊,請在package administration子區域中選取「View All Clusters」。

    3. 若要查看所有叢集的配置資訊,請在cluster administration子區域中選取「View All Clusters」。

可列印版本
隱私權聲明 使用範圍與著作權聲明
© Hewlett-Packard Development Company, L.P.