回到網頁內容 臺灣-繁體中文
HP.com 首頁 產品資訊 支�#169;及驅動程式 解決方案 如何購買
» 聯絡 HP
進階選項
HP.com 首頁
HP Serviceguard A.11.18 版版本需知 > 第 1 章. Serviceguard A.11.18 版版本需知

本版修正內容

» 

技術文件

PDF 格式的完整書籍
» 回饋意見
內容©韟像B開©l

 » 目錄

本節顯示舊版版本需知中列示為已知問題,而現已修復的部份。也就是說,以下修正程式是針對 A.11.17 版和 A.11.17.01 版版本需知中列示的瑕疵。

附註: Serviceguard A.11.18 版亦包含 Serviceguard 舊版中所有的修正程式;此處未一一記載這些修正程式。

JAGaf46654 (SR8606386500):cmcld:若備用區域網路卡失效,則軟體會造成連線中止

如何解決?若區域網路卡失效,或系統因硬體故障而找不到區域網路卡,則 cmcld 會在啟動時中止。

問題為何? cmcld 現在可在啟動時處理遺失的區域網路卡。程式碼已變更,因此當區域網路卡失效,且橋接網路中有備援可用時,將會進行本機切換。

JAGaf67601 (SR8606407696):cmcld 不考慮使用新的叢集鎖定驅動程式 (如 c8xx 和 mpt)

問題為何?尚未更新 cmcld 以處理新支援的叢集鎖定介面卡 (如分別使用 c8xxmpt 驅動程式的 Ultra160 和 Ultra320 卡) 之驅動程式。意即 cmcld 將叢集鎖定計時設為預設值 (最糟的情形),導致故障轉移的時候比預期還長 (約 60 秒,而非 30 秒),簡單的雙節點叢集之 c720 驅動程式只會有 2 秒的 NODE_TIMEOUT

如何解決?程式碼已修改為支援使用 c8xxmpt 驅動程式的 Ultra160 和 Ultra320。

JAGaf75382 (SR8606415528):lan2 擁有 IPv6 位址 (fec0:0:0:f08::36) 但不在配置檔內

問題為何? 此情形僅發生於使用 IPv6 配置時。當以 IPv6 位址配置的主要網路介面失敗,且 IPv6 位址的切換遇到 ENOMEM 時,便會在 syslog 內出現類似下列的訊息:

   There is(are) 1 incidence(s) of :
     Sep 11 16:34:38 ptest90 cmcld[11930]:Failed to switch
      fec0:0:0:f08::36 from lan1:34(0) to lan2:27(3): 
      Not enough space

任何後續的 Serviceguard 配置作業 (如 cmapplyconf 等) 會失敗。

如何解決?PHNE_34671 修補程式已修正,亦即 HP-UX 11i v2 的「累積 ARPA 傳輸修補程式」(請參閱「版本修補程式」)。現在若發生 ENOMEM,會保留來源介面卡上的 IP 而清除目的地介面卡上的 IP。

JAGag09818 (SR8606453031):無法將 SERVICE_HALT_TIMEOUT 修改為預設值 (0 秒)

問題為何?若從檔案中刪除整行,則您無法將套件配置檔中的 SERVICE_HALT_TIMEOUT 參數重新改為預設值 (0 秒)。

如何解決?程式碼已修改,可正確處理整行刪除作業。

JAGag11398 (SR8606454772):cmcld 中止並顯示 Failed to set keep alive: Invalid argument 訊息

問題為何? cmcld 中止並顯示

Failed to set keep alive: Invalid argument 訊息

如何解決?程式碼已修正,可在失敗時關閉 TCP 連線,並以 EINVAL 設定保持運作,而非中止 cmcld。如此應可重新建立連線,在最糟的情況下,可能會導致叢集重組。

JAGag12644 (SR8606456223):cmsrvassistd 不會檢查命令集權限

問題為何? 套件 service_cmd 參數指定的命令集或程式不存在或沒有執行權限時,cmsrvassistd 會不斷迴圈,並嘗試重新啟動服務,直到達到 service_restart 次數上限為止。

如何解決? 程式碼已修正,只允許在服務命令集存在且具有執行權限時重新啟動服務。

JAGag20225 (SR8606464542):Serviceguard 探測 CD、DVD 裝置

問題為何? 若 TEAC 和其他製造商生產的 CD 和 VCD 磁碟連至節點時,儘管命令成功,但 cmqueryclcmcheckconfcmapplyconf 仍會登錄錯誤。syslog 中可能會出現如下的訊息:

cmclconfd:Error looking up device /dev/dsk/c17t1d0:/dev/config is not open.cmclconfd:Unable to open disk /dev/rdsk/c0t0d0:Error 0

由於 TEAC CD/DVD 磁碟機具有獨特的週邊產品說明,因此未將其排除探測,因而無法偵測到這些 CD 或 DVD 產品。部份其他製造商生產的 CD 和 DVD 裝置會受到探測,因為其說明並未配置在 cmclconfd 中。

如何解決? cmclconfd 已修正,可排除探測更多 CD 和 DVD 裝置,包括特定的 TEAC 裝置。

JAGag21443 (SR8606465899):select() 中斷時,cmcld 會中止

問題為何? select() 系統呼叫被訊號中斷時 cmcld 會中止。

如何解決?若因系統呼叫中斷而失效,select() 系統呼叫現在會重試至多十次。

JAGag25508 (SR8606470417):日誌檔權限設為 666

問題為何?/etc/cmcluster.conf 中所定義的日誌檔權限設為 666 (允許任何人讀取或寫入檔案)。

如何解決?這些權限現在已設為 644,將寫入限制為檔案的擁有者。

JAGag35297 (SR8606481305):cfsmount 因套件已由 cmcld 啟動而失敗

  • 問題為何?此情形會影響 CFS 裝載點套件。當您執行 cfsmount 命令時,若所有節點上的套件已失效,則 cfsmount 可能會失敗,並顯示套件已啟動。

  • 解決方案:若 cfsmount 找到每個節點 (per-node) 狀態為 blocked 的套件,便會執行 cmhaltpkg -n 將狀態清除為 halted,然後執行 cmmodpkg 以允許 cmrunpkg 啟動套件。

JAGag41937 (SR8606489376):懸滯的節點問題導致 4 個節點當中的 2 個當掉

  • 問題為何?若其中一個節點在叢集重組時發生多重懸滯,可能會使兩個節點失效:發生懸滯的節點和候選為叢集調度者的節點。

  • 解決方案:已修改節點,因此叢集調度者不會失效。

JAGag48756 (SR8606496838):Serviceguard 的區域網路需求下限未隨 VM 偵測資訊更新

  • 問題為何?叢集使用虛擬機器從機做為節點,Serviceguard 命令 cmapplyconfcmcheckconfcmquerycl 的驗證階段可能會出現下列警告:

    Minimum network configuration requirements for the cluster have not been met.Minimum network configuration requirements are: 
    - 2 or more heartbeat networks OR
    - 1 heartbeat network with local switch (HP-UX Only) OR
    - 1 heartbeat network using APA with 2 trunk members (HP-UX Only) OR
    - 1 heartbeat network using bonding (mode 1) with 2 slaves (Linux Only). 

    此警告實際上是表示直接網路層級未達需求下限。若看到此警告,您需要確認整體網路配置符合需求下限。

  • 解決方案:若 VM 配置中有下列條件,您可以忽略此警告:從機上有一個心跳網路,此心跳網路如同警告文字中所列的第三種情況 (HPVM) 般利用附有兩個 APA 幹線成員,或者如同警告文字中所列的第四種情況 (VMware ESX Server) 使用 NIC 群集 (bonding,接合),而由主機上的網路輔助儲存。

JAGag46475 (SR8606494542):cmquerycl -f line 輸出會顯示錯誤的 VG 磁碟裝置檔案

  • 問題為何?若共用容體群組在不同的節點上使用 /etc/lvmtab 中的不同裝置檔案名稱,cmquerycl -f line 顯示的輸出會依照在 cmquerycl-n <節點> 選項中參照的第一個節點所配置顯示所有節點的裝置檔案。此舉可能會使 Serviceguard 管理員建立一個叢集配置檔,其中包含部分叢集節點之叢集鎖定容體的錯誤裝置檔案名稱。

  • 解決方案:已修改程式碼以顯示每個節點的正確裝置檔案名稱。

JAGag47195 (SR8606495273):在未啟用 IPv6 的系統上之 cmmodnet 的日誌訊息不正確

  • 問題為何?若未啟用系統上的 IPv6,使用 cmmodnet 新增一個 IPv6 位址到介面中會產生下列不正確的錯誤訊息:

    <位址> might already be configured as a heartbeat IP or stationary IP address.Or it does not belong to subnet <子網路>. 

    實際的問題在於未啟用 IPv6:cmmodnet 不會在嘗試新增位址前檢查系統上的 IPv6 是否已啟用。

  • 解決方案: cmmodnet 現在會先檢查系統上的 IPv6 是否已經啟用,再嘗試新增位址。

JAGag48606 (SR8606496688):cmmigratepkg 缺少 PEV 和外部命令集權限

  • 問題為何?cmmigratepkg 命令的 -e 選項應產生 Package Environment Variables (PEV),但是卻沒有產生。(若需 cmmigratepkg 的相關資訊,請參閱「將舊式套件轉移至模組式套件」)。

    此外,cmmigratepkg 輸出的外部命令集權限錯誤地設為 555,因而賦予所有人讀取和執行權限;744 是正確的,它僅將唯讀權限賦予擁有者以外的使用者 (擁有者必須是 root 使用者)。

  • 解決方案:已修改程式碼來修正這些問題。

QXCR1000594093:cmcheckconf 偵測叢集鎖定錯誤失敗

  • 問題為何?若叢集配置檔中缺少配置的鎖定磁碟,或未啟動其容體群組,cmcheckconf 就無法報告錯誤。cmapplyconf 不會偵測和報告錯誤。

  • 解決方案: cmcheckconfcmapplyconf 現在均會出現正常行為。

QXCR1000739586:Serviceguard 中止後未在 syslog 中正確地登錄 .cm_start_time 訊息

  • 問題為何?cmcld 中止且您重新啟動叢集而未先將發生中止的節點重新開機,syslog.log 中就會出現下列訊息:

    It appears that package applications or resources may be active on this node.Re-starting the cluster could cause data corruption.To recover from this situation reboot this system:After ensuring that no package applications or resources are active, you can override this data.For CFS customers, it is highly recommended that this node be rebooted.

    此訊息缺少重要的資訊;內容應該為:

    It appears that package applications or resources may be active on this node.Re-starting the cluster could cause data corruption.To recover from this situation reboot this system:
    
    	    shutdown -r   (stops package components)	
    
    After ensuring that no package applications or resources are active, you can override this data integrity protection by issuing the following commands (which allow the daemon to start without rebooting):
    	        rm /var/adm/cmcluster/.cm_start_time
    
    	        touch /var/adm/cmcluster/.cm_start_time
    
    For CFS customers, it is highly recommended that you reboot the node instead of using the data override mechanism
  • 解決方案: 現在錯誤訊息包含以上提供的完整版指示。

QXCR1000740150:cmcld 於線上刪除節點時中止

  • 問題為何?在叢集的執行期間執行 cmapplyconf 以刪除叢集配置中的節點時,若執行 cmapplyconf 的節點是欲刪除之節點的節點子集,cmcld 就會中止。

    例如,若自 node1 執行 cmapplyconf 以刪除 node10cmcld 便會中止並在 syslog.log 中顯示下列訊息:

    cmcld:Aborting!Deleting local node that is online(file:rcomm/comm_config.c, line:583)The cluster daemon aborted our connection (231).cmapplyconf:Unable to apply the configuration
  • 解決方案:已修改程式碼來避免此問題。

QXCR1000740395:應只顯示相關套件的子網路相關警告

  • 問題為何? 若一個叢集中並非所有節點上均可使用配置的 monitored_subnetcmapplyconfcmdeleteconf 會下達一個警告 (若這是跨子網路配置,則此配置可能是正確的;請參閱「關於跨子網路配置」)。問題在於警告適用於該叢集所配置的所有套件,而非僅適用於經由 cmapplyconfcmdeleteconf 配置的套件。

  • 解決方案: 現在會提供正確的警告 ─ 僅針對欲新增或修改的套件。

QXCR1000741571:懸滯的節點問題造成叢集當機

  • 問題為何?一個節點懸滯會導致多個叢集重新格式化,直到最後整個叢集失效為止。

  • 解決方案:已修改程式碼,使懸滯的節點不會再引起此問題。

QXCR1000746305:網站控制器程式套件無法在 cmhaltnode -f 之後啟動

  • 問題為何?當其中一個場地的所有節點均中止並出現 cmhaltnode -f 時,場地控制器程式套件 (site controller package) 可能無法在遠端網站上正常執行 (此問題可能發生在可判別場地的超長距離叢集中;請參閱「關於跨子網路配置」一節中的「其他資訊」子節)。

  • 解決方案:場地控制器套件現在可成功地執行。

QXCR1000747823:cmviewconf 不會顯示 SC 套件的受管理套件

  • 問題為何? cmviewconf 沒有報告場地控制器套件的受管理套件資訊 (此問題可能發生在可判別網站的超長距離叢集中;請參閱「關於跨子網路配置」一節中的「其他資訊」子節)。

  • 解決方案: cmviewconf 現在會正確地報告資訊。您也可以透過執行 cmviewcl -v -f line 來取得此資訊。

QXCR1000749527:cmmakepkg -l 不會列出非 SG 模組

  • 問題為何?cmmakepkg-l 選項應列出可用來建構一個套件的所有模組,但它目前只列出 Serviceguard 模組,未列出 MetroRAC dts/mcsc 模組等協力廠商模組。

  • 解決方案: cmmakepkg -l 現在會列出所有已安裝的模組。

QXCR1000749924:相依套件在非主要節點上啟動

  • 問題為何?即使符合在主要節點上的相依性,依賴一個多節點套件的故障轉移套件仍可能會在其主要節點以外的節點上啟動。

  • 解決方案:程式碼的行為會與原始設計一致。為確保相依套件會儘可能在其主要節點上執行,請將其 failback_policy 設為 automatic,若套件在非主要節點上啟動,就會在主要節點可供使用時立即自動地故障轉移。若需相關資訊,請參閱「關於多節點套件」

QXCR1000766057:未記載 cmviewcl 套件狀態「blocked」

  • 問題為何?cmviewcl 顯示多節點套件中每個節點的狀態為 blocked,但線上援助頁沒有說明「blocked」所代表的意思。

  • 解決方案:「Blocked」代表多節點套件從未在套件上執行。原因可能是因為未達到相依性,或者 auto_run 設為 no。已在 cmviewcl 線上援助頁新增此資訊。

    相依性是在套件配置檔中配置的;如需相關資訊,請參閱《管理 Serviceguard》的第 6 章。

QXCR1000766101:cmhaltpkg 報告多節點套件已停用 auto_run,但實際上並沒有

  • 問題為何?使用 cmhaltpkg 中止套件時,cmhaltpkg 會列印下列訊息:

    One or more packages or package instances have been halted.These packages have AUTO_RUN disabled and no new instance can start automatically.To allow automatic start, enable AUTO_RUN via cmmodpkg -e <套件_名稱>

    就命令行清單中的故障轉移套件而言確實如此,但對多節點套件來說則不是。

  • 解決方案: cmhaltpkg 現在會出現正確的行為。

本版 Serviceguard 管理員插入附加程式中已修正的問題

本節說明 Servicguard 管理員 B.01.01 版已修正的瑕疵。

JAGag05829:操作日誌視窗應指向剛執行的操作。

  • 問題為何?操作日誌無法分辨以下兩種更新動作:

    1. 由使用者觸發的更新動作在此情況下,上方的摘要表應該著重在使用者所選的那一列,並自動捲動至那一列的位置。

    2. 由管理或配置作業所觸發的更新動作在此情況下,上方的摘要表應該著重在上一次執行之操作的作業列,並自動捲動至最上方。

  • 解決方案:過去 20 秒 (或 1 分鐘內的任意時間長度) 的操作將以粗體字型顯示。即使重點在另一行上,您仍能夠快速辨別最新的操作。

JAGag05831:一些操作並未立即顯示在操作日誌中

  • 問題為何?操作日誌瀏覽器視窗的更新不是由非管理或非配置操作所觸發。

  • 解決方案:重新設計過的 DSAU 配置可使用標準的操作日誌重新導向機制。

JAGag07820:無法處理具有無效之 * / \ 空格等字元的叢集名稱

  • 問題為何?當您在叢集名稱欄位指定無效的字元 (如 * \ / 或空格) 且接著跳至另一個頁籤時,Serviceguard 管理員並未針對此問題提出任何警告。

  • 解決方案: Serviceguard 管理員現在會在建立新叢集之前檢查有效的叢集名稱。

JAGag07875:編輯叢集摘要頁面:應限制與套件配置相關的警告

  • 問題為何?若使用者新增節點至叢集中,且此叢集已配置套件在所有節點上執行,則摘要頁面會顯示警告訊息:「The following packages will be automatically configured on the new cluster member nodes:」,接著是將配置在新節點上的套件清單。

    就算叢集中沒有套件,或是叢集僅包含未在新增節點上配置的套件,還是會顯示此警告訊息。

  • 解決方案:Serviceguard 管理員現在在顯示警告訊息之前,會先檢查是否有任何套件。

JAGaf97851:啟動系統日誌檢視器 (System Log Viewer) 時,Serviceguard 管理員懸滯

  • 問題為何?若已開啟系統日誌檢視器 (System Log Viewer) 時使用「顯示彙整的 syslog」 功能表項目啟動 Serviceguard 管理員日誌檢視器,則 Serviceguard 管理員會懸滯。

  • 解決方案:問題已修正。

JAGag11832:首次啟動彙整的 syslog 導致 SMH 登出

  • 問題為何?若首次配置彙整日誌視窗後立即嘗試啟動該日誌視窗,則 SMH 會自動將您登出系統。

  • 解決方案:問題已修正。

QXCR1000581069:若選取的套件未關機,則刪除多個套件會失敗

  • 問題為何?若選取的套件未關機,則在 Serviceguard 管理員中刪除多個套件會失敗。

  • 解決方案:Serviceguard 管理員會列印出一個訊息,指出可刪除的已選取套件和不可刪除的套件。您可以要求 Serviceguard 管理員刪除可刪除的套件子集。

QXCR1000591254:工具提示值不正確

  • 問題為何?Serviceguard 管理員屬性頁中,顯示在「服務狀況」欄之上的工具提示將未初使化的列為其中一個可能的值,但這是不正確的。

  • 解決方案:已移除不正確的值。

QXCR1000741159:不正確的錯誤訊息

QXCR1000752875:使用 Serviceguard 管理員編輯具環境變數的 CFS 套件,會損毀套件配置檔

  • 問題為何?Serviceguard 管理員無法防止使用者修改或刪除 Veritas 叢集檔案系統 (CFS) 套件。

  • 解決方案:Serviceguard 管理員不再允許您修改或刪除 CFS 套件,但會正確地在套件屬性表中顯示 CFS 環境變數。

QXCR1000765143 SGMgr 無法探索 Oracle DB 及 10G 和 11G 上的應用例。

  • 問題為何?在 Serviceguard Extension for Oracle RAC (SGeRAC) 安裝作業中,Serviceguard 管理員無法探索 Oracle 10g RAC 和 11g RAC 資料庫和應用例。

  • 解決方案:已更新 Oracle 資料庫探索命令集來修正此問題。

可列印版本
隱私權聲明 使用範圍與著作權聲明
© Hewlett-Packard Development Company, L.P.