回到網頁內容 臺灣-繁體中文
HP.com 首頁 產品資訊 支�#169;及驅動程式 解決方案 如何購買
» 聯絡 HP
進階選項
HP.com 首頁
HP Serviceguard Version A.11.18 版版本需知 > 第 1 章. Serviceguard A.11.18 版版本需知

已知的問題與解決方案

» 

技術文件

PDF 格式的完整書籍
» 回饋意見
內容©韟像B開©l

 » 目錄

 » 索引

本節列出 Serviceguard A.11.18 版出版時已知的問題。本清單如有變更,恕不另行通知。

若需最新的資訊,請造訪 HP IT 資源中心:http://www.itrc.hp.com (美洲及亞太地區) 或 http://www.europe.itrc.hp.com (歐洲)。

若需最新資訊,請洽詢您的 HP 支援工程師。

JAGad39695 (SR8606170431):使用者錯誤可導致「ghost」服務。

  • 問題為何?套件在參照至它其中一個已移除的服務時關閉,且服務在套件中止期間失敗。

    在此情況下,由於服務已不存在,因此無法手動中止它,否則會導致下列錯誤:

    cmhaltserv : Service name oasmon is not running.

    由於服務失效,因此 cmsrvassistd 會嘗試重新啟動服務 (因為它從未中止)。但是,當 cmsrvassistd 註冊重新啟動的服務時,它的狀態項目已被 cmcld 移除 (因為套件關閉)。使用者下達 cmapplyconf 時,雖然 cmsrvassistd 仍嘗試重新啟動服務,但是服務已永久自 cmcld 移除。因此,在 cmapplyconf 後,仍無法停止這個「ghost」服務,因為 cmcld 否認其存在。

  • 如何解決?一種解決方案是確認遵循正確的程序移除服務:開始編輯任何檔案之前請中止套件。

    但若真的發生了此情況:

    • 請遵循下列步驟:

      1. 中止套件

      2. 將服務新增回 ASCII 檔案內

      3. 重新套用配置

      4. 利用 cmhaltserv 手動中止服務

      5. 自 ASCII 檔案重新移除服務

      6. 重新套用配置

      7. 重新啟動套件

    • 另一個解決方案是增加一個新套件,其服務名稱與原始刪除的服務相同,接著再利用 cmhaltserv 中止服務,如此便無需中止套件、節點,或叢集,即可解決問題。

    • 或者,若叢集 (節點) 已中止,重新啟動後問題即不再出現。但是,此解決方案需要叢集 (節點) 停機時間,而在 24x7 環境中不太可行。

JAGad54887 (SR8606185685):探測停用磁碟時,cmquerycl 命令可能會懸滯

  • 問題為何?如果探測磁碟的 Serviceguard 命令 (如 cmquerycl) 遇到停用的磁碟,該命令可能會懸滯。

  • 如何解決?如果整個磁碟配置 (LUN 數目) 不大,請等候該命令完成,否則請用 CTRL-C 中斷命令。

JAGaf32484 (SR8606372066):自 CVM 3.2 移至 3.5 時進行輪替式昇級發生問題

  • 問題為何?無法在安裝 CVM 3.2 的 Serviceguard 叢集中,執行 CVM 3.2 至 CVM 3.5 的輪替式昇級。節點昇級至 CVM 3.5 後,企圖重新加入 CVM 叢集時會失敗,可能會導致系統重設。

    無論 HP-UX 作業系統版本是否在輪替式昇級期間變更,此問題皆會存在。「輪替式昇級」意指中止叢集中的一個節點、將 CVM 昇級至 3.5 版、將節點重新啟動回叢集中,最後對叢集中的每一個節點執行相同的步驟。叢集從未完全中止。但是,此問題要求叢集至少在某段時間內要完全中止,因為無法執行混合 CVM 3.2 和 3.5 的叢集。

  • 如何解決?

    解決方案是針對欲自 CVM 3.2 昇級至 3.5 的叢集執行半輪替式昇級。此方案需要一小段停機時間。

    這個解決方案需管制叢集內的節點,使叢集內的所有節點僅執行 CVM 3.2 或 CVM 3.5,但絕不會混用兩者。欲執行此作業:

    1. 當其他節點仍在叢集內執行 CVM 3.2 時,在一或多個叢集節點上中止 Serviceguard。

    2. 在 Serviceguard 叢集中未執行的節點上自 CVM 3.2 昇級至 3.5,但 CVM 昇級完成時,不要在 Serviceguard 叢集中重新啟動這些節點。

    3. 現在,當您能關閉整個叢集時,在 Serviceguard 叢集中仍執行的某一節點上執行 cmhaltcl -f

    4. 叢集成功中止後,在昇級至 CVM 3.5 的節點上啟動 Serviceguard 叢集。欲進行此動作,不可以執行正常的 cmruncl 命令以啟動 Serviceguard 叢集,因為此命令會試圖啟動所有叢集節點。您應執行 cmviewcl -n 節點1 -n 節點2 -n 節點n,其中指定的節點為已昇級至 CVM 3.5 的節點。

    5. 現在請於叢集內的其餘節點上將 CVM 自 3.2 昇級至 3.5。

    6. 在每個節點上完成 CVM 3.5 的昇級後,可在該節點上執行 cmrunnode 命令,將節點重新加入執行中的 Serviceguard 叢集。

    舉例來說,在一個四節點的叢集中,可取下叢集中的兩個節點並將 CVM 昇級至 3.5,而其餘兩個節點則繼續在叢集內執行 CVM 3.2。之後中止整個叢集,並在昇級至 CVM 3.5 的兩個節點上啟動叢集。現在將其餘的 CVM 3.2 節點昇級至 CVM 3.5,昇級完成後,這些節點即可新增回叢集內。

JAGaf79389(SR8606419559):執行 cmhaltnode -f 後套件未在承接節點上啟動

問題為何?執行 cmhaltnode -f 後,套件未在承接節點上啟動。

當節點已關機且 node_fail_fast_enabled 設為 yes 的套件中止命令集超出其 halt-script_timeout 時,就會發生此情形。Serviceguard 會刪除中止命令的處理程序,而節點則會執行系統重設。套件不會在承接節點上重新啟動。

如何解決?目前無解決方案。

JAGag27186 (SR8606472298):在 HP-UX 11i v3 上,SG 叢集中區域網路卡的 OLR 作業失敗

問題為何?由於關鍵資源分析 (Critical Resource Analysis,CRA) 隨附 OLR 作業執行時傳回 CRA_SYS_CRITICAL,因此在 HP-UX 11i v3 線上替換 (OLR) Serviceguard 叢集中的區域網路卡會失敗。無論您使用周邊設備裝置工具 (pdweb) 或 HP-UX olrad 命令,都會在 HP-UX 11i v3 上遇到這個問題。

如何解決?套用修補程式 PHNE_35894 (若需修補程式的相關資訊,請參閱「版本修補程式」)。

附註: 您無需重新開機即可套用修補程式。

在已套用修補程式的系統上,您將能夠執行線上替換可熱機抽換的介面卡 (無需關閉叢集)。若需相關資訊,請參閱《《管理 Serviceguard》》第八章的「更換區域網路或光纖通道卡」 (您可在 http://docs.hp.com ->
High Availability -> Serviceguard
中找到此手冊)。

附註: 若基於某些因素您必須在沒有修補程式的情況下繼續作業,則必須遵循《《管理 Serviceguard》》第八章「更換區域網路或光纖通道卡」下的「離線更換」程序。

JAGag31490 (SR8606477006):模組式套件失效並出現錯誤:「Unable to retrieve package attribute」

問題為何?在配置了超過 100 個套件的叢集中,當叢集和套件同時啟動時,部份套件可能無法啟動。模組式套件日誌檔中可能會出現錯誤:Unable to retrieve package attributes,且套件無法啟動。套件日誌檔中會出現如下訊息:

Feb  7 09:00:50 root@aialik.cup.hp.com master_control_script.sh[11121]: ERROR: Unable to retrieve package attributes. Feb  7 09:00:50 root@aialik.cup.hp.com master_control_script.sh[11121]: ERROR: Function sg_source_pkg_env

此訊息代表 cmgetpkgenv 命令無法取得執行套件命令檔所需的套件相關資訊。這並不表示套件無法在其他套件穩定後啟動。

如何解決?若您看見此問題,可以在未啟動的套件中下達 cmrunpkg

JAGag41937 (SR8606489376):懸滯的節點問題導致 4 個節點當中的 2 個當掉

  • 問題為何?若其中一個節點在叢集重組時發生多重懸滯,可能會使兩個節點失效:發生懸滯的節點和候選為叢集調度者的節點。

  • 如何解決?目前無解決方案。

JAGag43145 (SR8606490767):cmcheckconf 因不存在的延遲檔案系統 EMS 資源而失效

  • 問題為何?若您嘗試套用一個包含不存在之延遲 EMS 資源的新套件或現有套件,cmcheckconf 命令會失效。此類資源的範例即為必須等到套件啟動才會裝載,因而無法在 cmcheckconfcmapplyconf 期間通過資源驗證的檔案系統。

  • 如何解決?在執行 cmcheckconfcmapplyconf 之前手動建立資源。例如,若為檔案系統,請執行下列步驟:

    1. 在第一個節點上,啟動容體群組並裝載檔案系統。

    2. 在其他節點上,在唯讀模式下啟動容體群組 (vgchange -r),並以唯讀方式裝載檔案系統。

    3. 執行 cmcheckconf 和 (或) cmapplyconf

    4. 卸載每個節點上的檔案系統。

    5. 停用所有節點上的容體群組。

JAGag44319 (SR8606492148):cmcluster 開機命令集不會列印 cmrunnode 錯誤

  • 問題為何?AUTOSTART_CMCLD 設為 1 而 cmrunnode 在節點開機後成功啟動叢集,則不會將啟動時的連線問題 (若有的話) 登錄到
    /etc/rc.log 中。

  • 如何解決?cmrunnode 錯誤 (除命令日誌外) 存在 syslog 檔案中。

JAGag46475 (SR8606494542):cmquerycl -f 行輸出會顯示錯誤的 VG 磁碟裝置檔案

  • 問題為何?若共用容體群組在不同的節點上使用 /etc/lvmtab 中的不同裝置檔案名稱,cmquerycl -f line 顯示的輸出會依照在 cmquerycl 的 -n <節點> 選項中參照的第一個節點所配置顯示所有節點的裝置檔案。此舉可能會使 Serviceguard 管理員建立一個叢集配置檔,其中包含部分叢集節點之叢集鎖定容體的錯誤裝置檔案名稱

  • 如何解決?使用同樣的裝置檔案命名慣例 (舊式或敏捷定址) 和裝置檔案名稱為叢集中所有節點配置共用磁碟。

JAGae47195 (SR8606495273):在未啟用 IPv6 的系統上之 cmmodnet 的日誌訊息不正確

  • 問題為何?若未啟用系統上的 IPv6,使用 cmmodnet 新增一個 IPv6 位址到介面中會產生下列不正確的錯誤訊息:

    <address> might already be configured as a heartbeat IP or stationary IP address. Or it does not belong to subnet <subnet>. 

    實際的問題在於未啟用 IPv6:cmmodnet 不會在嘗試新增位址前檢查系統上的 IPv6 是否已啟用。

  • 如何解決?確認系統上的 IPv6 已啟用,再使用 IPv6 執行任何作業。若看見此訊息,請確認是否已啟用 Ipv6,如有必要則將它啟用。

JAGaf48606 (SR8606496688):cmmigratepkg 缺少 PEV 和外部命令集權限

  • 問題為何?cmmigratepkg 命令的 -e 選項應產生 Package Environment Variables (PEV),但是卻沒有產生。(若需 cmmigratepkg 的相關資訊,請參閱「將舊式套件轉移至模組式套件」)。

    此外,cmmigratepkg 輸出的外部命令集權限錯誤地設為 555,因而賦予所有人讀取和執行權限;744 是正確的,它僅將唯讀權限賦予擁有者以外的使用者 (擁有者必須是 root 使用者)。

  • 如何解決?透過編輯 cmmigratepkg 輸出的套件配置檔,手動產生 PEV。針對舊版 (舊式) 套件控制命令集中的每個非 Serviceguard 變數名稱和值,在新的 (模組式) 套件配置檔中定義一個對應的變數和值。(若需模組式套件的相關資訊,請參閱「配置套件的新方法」)。

    例如,若舊式套件控制命令集有

    ROOT_DIR="/var/opt/apple"

    將下列內容新增至模組式套件配置檔:

    PEV_ROOT_DIR "/var/opt/apple"

    您也將需要變更 cmmigratepkg 輸出的任何外部命令集之權限;例如,以使用者的 root 身分:

    chmod 744 /etc/cmcluster/pkg/pkgA/myexternal.sh

JAGag48756 (SR8606496838): Serviceguard 的區域網路需求下限未隨 VM 偵測資訊更新

  • 問題為何?叢集使用虛擬機器從機做為節點,Serviceguard 命令
    cmapplyconfcmcheckconfcmquerycl 的驗證階段可能會出現下列警告:

    Minimum network configuration requirements for the cluster have not been met. Minimum network configuration requirements are: - 2 or more heartbeat networks OR - 1 heartbeat network with local switch (HP-UX Only) OR - 1 heartbeat network using APA with 2 trunk members (HP-UX Only) OR - 1 heartbeat network using bonding (mode 1) with 2 slaves (Linux Only). 

    如果 VM 從機上有一個心跳網路,由主機上的網路使用 APA 搭配兩個幹線成員輔助 (警告中列的第三種情形),則會錯誤地出現警告。問題在於 Serviceguard 無法驗證是否已在主機上配置 APA。

  • 如何解決?HPVM 從機上由 APA 搭配兩個主機幹線成員輔助的心跳網路符合心跳網路的需求下限。如果網路配置下限存在,您可以忽略警告。

Serviceguard 管理員插入附加程式的已知問題和解決方案

本節記載 Serviceguard 管理員 B.01.01 的已知問題和建議解決方法。

JAGag35535:新增節點至具有鎖定 LUN 的節點失敗

  • 問題為何?新增節點至已配置鎖定 LUN 的現有叢集失敗。

  • 如何解決?提供的修補程式為何?直接使用 cmquerycl 命令,搭配
    -L 選項指定每一個新的節點。

JAGag34285:標題:若選取的套件未關機,則刪除多個套件將失敗

  • 問題為何?Serviceguard 管理員顯示適當的蹦現式警告訊息,告知您不可刪除未關閉的套件,但當您按一下 OK 並繼續關閉套件時,作業失敗。

    操作日誌指出 Serviceguard 管理員嘗試刪除所有選取的套件,包括未關閉的套件。

  • 如何解決?提供的修補程式為何?確認您所選取的所有套件均已關閉 (未執行) 再嘗試刪除。

JAGag04773:按一下瀏覽器更新按鈕後跳回主要頁面

  • 問題為何?按一下任何 Serviceguard 管理員頁面的瀏覽器更新按鈕會使您跳回 Serviceguard 管理員主要頁面。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

JAGag32353:搭配 Mozilla 或 Firefox 瀏覽器時,配置 SGeRAC 套件會令人迷惑

  • 問題為何?使用 Mozilla 或 Firefox 瀏覽器建立或編輯 SGeRAC 套件時,若子網路標示為受監視,則變更「叢集互連子網路」(Cluster Interconnect Subnet) 旗標將取消標示子網路。

  • 如何解決?提供的修補程式為何?若您變更「叢集互連子網路」(Cluster Interconnect Subnet) 而取消標示子網路,請再按一下勾選框重新選取。

JAGag22514:操作日誌強調在操作結束後回到前一個選項

  • 問題為何?若操作日誌視窗列出多個作業,而您選取與其中之一對應的單選按鈕 (但非清單中的第一個),並執行另一個管理或配置作業,操作日誌會顯示已執行的操作,並在底部的表格中顯示對應說明。不過,一旦操作結束後,重點會回到先前選取的單選按鈕。

  • 如何解決?提供的修補程式為何?捲動至操作日誌的頂端,並找出欲檢視的操作。

JAGag05524:編輯角色和受監視的資源時,某些按鈕無法使用

  • 問題為何? 配置叢集或套件時:

    1. 若在表單輸入值後忘記按下「新增」按鈕,您在表單中輸入的資料便會遺失。

    2. 若在表單中輸入任何不正確的值,則按下「新增」按鈕時並不會顯示任何錯誤訊息。只有在選取不同的頁籤時才會顯示錯誤訊息。某些情況下會從清單中移除包含無效值的行。

    3. 在某些情況下,若有輸入錯誤所導致的錯誤訊息,則會停用某些按鈕。

  • 如何解決?提供的修補程式為何?請執行下列其中一項步驟:

    • 移至下一個頁籤之前,務必按一下「新增」按鈕。

    • 按一下「新增」並移至下一個頁籤之前,務必輸入有效的資訊。

    • 若「移除」按鈕已停用,請切換至另一個頁籤,再切換回來。

    • 若「編輯」按鈕已停用,則請移除該行並重新新增。

    • 出現錯誤訊息後,若某些已輸入的資料不見了,請重新輸入。

JAGag29458:對照表視界中未顯示空白欄

  • 問題為何?對照表視界未顯示空白欄。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

JAGag32176:使用 Mozilla 1.5 時,「自動刷新」按鈕會在第一次自動更新之後出現

  • 問題為何?在 Mozilla 1.5 中,首頁上的「自動刷新」按鈕只會在第一次自動更新後出現。此問題僅發生於 Mozilla 1.5 瀏覽器中。新版的 Mozilla 或其他任何支援的瀏覽器均不會發生此問題。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

JAGag31375:叢集延伸區中的 SGeSAP 不見了

  • 問題為何?您可能安裝或配置了 SGeSAP 延伸,但「延伸」頁籤並未在清單中顯示 SGeSAP。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

JAGag28015:重新啟動 clog 後啟用了所有下拉式功能表選項

  • 問題為何?重新啟動 clog 套件後,隨即啟用了所有下拉式功能表選項。當 clog 套件執行於非執行 SMH (System Management Homepage) 的節點上時,便會發生此問題。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

可列印版本
隱私權聲明 使用範圍與著作權聲明
© Hewlett-Packard Development Company, L.P.