回到網頁內容 臺灣-繁體中文
HP.com 首頁 產品資訊 支�#169;及驅動程式 解決方案 如何購買
» 聯絡 HP
進階選項
HP.com 首頁
HP Serviceguard A.11.18 版版本需知 > 第 1 章. Serviceguard A.11.18 版版本需知

已知的問題與解決方案

» 

技術文件

PDF 格式的完整書籍
» 回饋意見
內容©韟像B開©l

 » 目錄

本節列出 Serviceguard A.11.18 版出版時已知的問題。本清單如有變更,恕不另行通知。

您可自 HP IT 資源中心 (IT Resource Center) 取得最新的資訊:http://www.itrc.hp.com (美洲及亞太地區) 或 http://www.europe.itrc.hp.com (歐洲)。

若需最新資訊,請洽詢您的 HP 支援工程師。

JAGad39695 (SR8606170431):使用者錯誤可能會導致「ghost」服務:

  • 問題為何?套件在參照至它其中一個已移除的服務時關閉,且服務在套件中止期間失敗。

    在此情況下,由於服務已不存在,因此無法手動中止它,否則會導致下列錯誤:

    cmhaltserv : Service name oasmon is not running.

    由於服務失敗,因此 cmsrvassistd 會嘗試重新啟動服務 (因為它從未中止)。但是,當 cmsrvassistd 註冊重新啟動的服務時,它的狀態項目已被 cmcld 移除 (因為套件關閉)。使用者下達 cmapplyconf 時,雖然 cmsrvassistd 仍嘗試重新啟動服務,但是服務已永久自 cmcld 移除。因此,在 cmapplyconf 後,仍無法停止這個「ghost」服務,因為 cmcld 否認其存在。

  • 如何解決?解決方法之一是確認遵循正確的程序移除服務:開始編輯任何檔案之前請中止套件。

    但若真的發生了此情況:

    • 請遵循下列步驟:

      1. 中止套件

      2. 將服務新增回 ASCII 檔案內

      3. 重新套用配置

      4. 利用 cmhaltserv 手動中止服務

      5. 自 ASCII 檔案重新移除服務

      6. 重新套用配置

      7. 重新啟動套件

    • 另一個解決方案是增加一個新套件,其服務名稱與原始刪除的服務相同,接著再利用 cmhaltserv 中止服務,如此便無需中止套件、節點,或叢集,即可解決問題。

    • 或者,若叢集 (節點) 已中止,重新啟動後問題即不再出現。但是,此解決方案需要叢集 (節點) 停機時間,因而在全年無休的環境中不太可行。

JAGad54887 (SR8606185685):探測停用磁碟時,cmquerycl 命令可能會懸滯

  • 問題為何?如果探測磁碟的 Serviceguard 命令 (如 cmquerycl) 遇到停用的磁碟,該命令可能會懸滯。

  • 如何解決?如果整個磁碟配置 (LUN 數目) 不大,請等候該命令完成,否則請用 CTRL-C 中斷命令。

JAGaf32484 (SR8606372066):自 CVM 3.2 移至 3.5 時進行輪替式昇級發生問題

  • 問題為何?無法在安裝 CVM 3.2 的 Serviceguard 叢集中,執行 CVM 3.2 至 CVM 3.5 的輪替式昇級。節點昇級至 CVM 3.5 後,企圖重新加入 CVM 叢集時會失敗,可能會導致系統重設。

    無論 HP-UX 作業系統版本是否在輪替式昇級期間變更,此問題皆會存在。「輪替式昇級」(rolling upgrade) 意指中止叢集中的一個節點、將 CVM 昇級至 3.5 版、將節點重新啟動回叢集中,最後對叢集中的每一個節點執行相同的步驟。叢集從未完全中止。但是,此問題要求叢集至少在某段時間內要完全中止,因為無法執行混合 CVM 3.2 和 3.5 的叢集。

  • 如何解決?

    解決方案是針對欲自 CVM 3.2 昇級至 3.5 的叢集執行半輪替式昇級。此方案需要一小段停機時間。

    這個解決方案需管制叢集內的節點,使叢集內的所有節點僅執行 CVM 3.2 或 CVM 3.5,但絕不會混用兩者。欲執行此作業:

    1. 當其他節點仍在叢集內執行 CVM 3.2 時,在一或多個叢集節點上中止 Serviceguard。

    2. 在 Serviceguard 叢集中未執行的節點上自 CVM 3.2 昇級至 3.5,但 CVM 昇級完成時,不要在 Serviceguard 叢集中重新啟動這些節點。

    3. 現在,當您能關閉整個叢集時,在 Serviceguard 叢集中仍執行的某一節點上執行 cmhaltcl -f

    4. 叢集成功中止後,在昇級至 CVM 3.5 的節點上啟動 Serviceguard 叢集。欲進行此動作,不可以執行正常的 cmruncl 命令以啟動 Serviceguard 叢集,因為此命令會試圖啟動所有叢集節點。您應執行 cmviewcl -n 節點1 -n 節點2 -n 節點n,其中指定的節點為已昇級至 CVM 3.5 的節點。

    5. 現在請於叢集內的其餘節點上將 CVM 自 3.2 昇級至 3.5。

    6. 在每個節點上完成 CVM 3.5 的昇級後,可在該節點上執行 cmrunnode 命令,將節點重新加入執行中的 Serviceguard 叢集。

    舉例來說,在一個四節點的叢集中,可取下叢集中的兩個節點並將 CVM 昇級至 3.5,而其餘兩個節點則繼續在叢集內執行 CVM 3.2。之後中止整個叢集,並在昇級至 CVM 3.5 的兩個節點上啟動叢集。現在將其餘的 CVM 3.2 節點昇級至 CVM 3.5,昇級完成後,這些節點即可新增回叢集內。

JAGaf79389 (SR8606419559):cmhaltnode -f 之後,套件未在承接節點上啟動

問題為何?cmhaltnode -f 後,套件未在承接節點上啟動。

當節點已關機且 node_fail_fast_enabled 設為 yes 的套件中止命令集超出其 halt-script_timeout 時,就會發生此情形。Serviceguard 會殺掉 (kill) 中止命令集的處理程序,而節點則會執行系統重設。套件不會在承接節點上重新啟動。

如何解決?目前無解決方案。

JAGag27186 (SR8606472298):在 HP-UX 11i v3 上,SG 叢集中區域網路卡的 OLR 作業失敗

問題為何?由於關鍵資源分析 (Critical Resource Analysis,CRA) 隨附 OLR 作業執行時傳回 CRA_SYS_CRITICAL,因此在 HP-UX 11i v3 線上替換 (OLR) Serviceguard 叢集中的區域網路卡會失敗。無論您使用周邊設備裝置工具 (pdweb) 或 HP-UX olrad 命令,都會在 HP-UX 11i v3 上遇到這個問題。

如何解決?套用修補程式 PHNE_35894(若需修補程式的相關資訊,請參閱「版本修補程式」)。

附註: 您無需重新開機即可套用修補程式。

在已套用修補程式的系統上,您將能夠執行線上替換可熱機抽換的介面卡 (無需關閉叢集)。若需相關資訊,請參閱《管理 Serviceguard》第 8 章的「更換區域網路或光纖通道卡」(您可在 http://docs.hp.com/zh_tw -> 全部繁體中文產品文件 -> Serviceguard 中找到此手冊)。

附註: 若基於某些因素您必須在沒有修補程式的情況下繼續作業,則必須遵循《管理 Serviceguard》第 8 章「更換區域網路或光纖通道卡」下的「離線更換」程序。

JAGag31490 (SR8606477006):模組式套件失效並出現錯誤:「Unable to retrieve package attribute」。

問題為何?在配置了超過 100 個套件的叢集中,當叢集和套件同時啟動時,部份套件可能無法啟動。模組式套件日誌檔中可能會出現錯誤:Unable to retrieve package attributes,且套件無法啟動。套件日誌檔中會出現如下訊息:

Feb  7 09:00:50 root@aialik.cup.hp.com master_control_script.sh[11121]:ERROR:Unable to retrieve package attributes.Feb  7 09:00:50 root@aialik.cup.hp.com master_control_script.sh[11121]:ERROR:Function sg_source_pkg_env

此訊息代表 cmgetpkgenv 命令無法取得執行套件命令檔所需的套件相關資訊。這並不表示套件無法在其他套件穩定後啟動。

如何解決?若您看見此問題,可以在未啟動的套件中下達 cmrunpkg

JAGag43145 (SR8606490767):cmcheckconf 因不存在的延遲檔案系統 EMS 資源而失效

  • 問題為何?若您嘗試套用一個包含不存在之延遲 EMS 資源的新套件或現有套件,cmcheckconf 命令會失效。此類資源的範例即為必須等到套件啟動才會裝載,因而無法在 cmcheckconfcmapplyconf 期間通過資源驗證的檔案系統。

  • 如何解決?在執行 cmcheckconfcmapplyconf 之前手動建立資源。例如,若為檔案系統,請執行下列步驟:

    1. 在第一個節點上,啟動容體群組並裝載檔案系統。

    2. 在其他節點上,在唯讀模式下啟動容體群組 (vgchange -r),並以唯讀方式裝載檔案系統。

    3. 執行 cmcheckconf 和 (或) cmapplyconf

    4. 卸載每個節點上的檔案系統。

    5. 停用所有節點上的容體群組。

JAGag44319 (SR8606492148):cmcluster 開機命令集不會列印 cmrunnode 錯誤

  • 問題為何?AUTOSTART_CMCLD 設為 1 而 cmrunnode 在節點開機後成功啟動叢集,則不會將啟動時的連線問題 (若有的話) 登錄到 /etc/rc.log 中。

  • 如何解決?cmrunnode 錯誤 (除命令日誌外) 存在 syslog 檔案中。

QXCR1000768063:Serviceguard A.11.18 版網路驗證錯誤不見了

  • 問題為何?當網路驗證於叢集節點啟動時失效,並未將錯誤記錄下來。例如,當 cmruncl 偵測到網路配置錯誤時,產生了如下的輸出內容:

    cmruncl:Validating network configuration...cmruncl:Failed to validate the network configuration as reported above but will try to start the cluster anyway.cmruncl:Network validation completecmruncl:Validating cluster lock disk ....DoneWaiting for cluster to form ..... doneCluster successfully formed.Check the syslog files on all nodes in the cluster to verify that no warnings occurred during startup.

    類似的輸出內容出現在 syslog 中。兩種情況都沒有報告「以上報告的」錯誤。cmrunnode 報告網路驗證錯誤,但也不會將錯誤登錄在 syslog 中。

  • 如何解決?目前無解決方案。

QXCR1000770172:若缺少某些 PV 連結,cmgetconf 就會失效

  • 問題為何?如果缺少了其中一個連至 LVM 邏輯容體的 PV (實體容體) 連結,cmgetconf (和 Serviceguard 管理員) 將無法識別叢集的容體群組。

  • 如何解決?目前無解決方案。

Serviceguard 管理員插入附加程式的已知問題和解決方案

本節記載 Serviceguard 管理員 B.01.01 的已知問題和建議解決方法。

JAGag35535:新增節點至具有鎖定 LUN 的節點失敗

  • 問題為何?新增節點至已配置鎖定 LUN 的現有叢集失敗。

  • 如何解決?提供的修補程式為何?直接使用 cmquerycl 命令,搭配 -L 選項指定每一個新的節點。

JAGag34285:若選取的套件未關機,則刪除多個套件將失敗

  • 問題為何?Serviceguard 管理員顯示適當的蹦現式警告訊息,告知您不可刪除未關閉的套件,但當您按一下「確定」並繼續關閉套件時,作業失敗。

    操作日誌指出 Serviceguard 管理員嘗試刪除所有選取的套件,包括未關閉的套件。

  • 如何解決?提供的修補程式為何?確認您所選取的所有套件均已關閉 (未執行) 再嘗試刪除。

JAGag04773:按一下瀏覽器刷新按鈕後跳回首頁

  • 問題為何?按一下任何 Serviceguard 管理員頁面的瀏覽器刷新按鈕會使您跳回 Serviceguard 管理員主要頁面。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

JAGag32353:搭配 Mozilla 或 Firefox 瀏覽器時,配置 SGeRAC 套件會令人困惑

  • 問題為何?使用 Mozilla 或 Firefox 瀏覽器建立或編輯 SGeRAC 套件時,若子網路標示為「受監視的」,則變更「叢集互連子網路」(Cluster Interconnect Subnet) 旗標將取消標示子網路。

  • 如何解決?提供的修補程式為何?若您變更叢集互連子網路而取消標示子網路,請再按一下勾選框重新選取。

JAGag22514:操作日誌強調在作業結束後回到前一個選項

  • 問題為何?若操作日誌視窗列出多個操作,而您選取與其中之一對應的單選按鈕 (但非清單中的第一個),並執行另一個管理或配置操作,操作日誌會顯示已執行的操作,並在底部的表格中顯示對應說明。不過,一旦操作結束後,重點會回到先前選取的單選按鈕。

  • 如何解決?提供的修補程式為何?捲動至操作日誌的頂端,並找出欲檢視的操作。

JAGag05524:編輯角色和受監視的資源時,某些按鈕無法使用

  • 問題為何?配置叢集或套件時:

    1. 若在表單輸入值後忘記按下「新增」按鈕,您在表單中輸入的資料便會遺失。

    2. 若在表單中輸入任何不正確的值,則按下「新增」按鈕時並不會顯示任何錯誤訊息。只有在選取不同的頁籤時才會顯示錯誤訊息。某些情況下會從清單中移除包含無效值的行。

    3. 在某些情況下,若有輸入錯誤所導致的錯誤訊息,則會停用某些按鈕。

  • 如何解決?提供的修補程式為何?請執行下列其中一項步驟:

    • 移至下一個頁籤之前,務必按一下「新增」按鈕。

    • 按一下「新增」並移至下一個頁籤之前,務必輸入有效的資訊。

    • 若「移除」按鈕已停用,請切換至另一個頁籤,再切換回來。

    • 若「編輯」按鈕已停用,則請移除該行並重新新增。

    • 出現錯誤訊息後,若某些已輸入的資料不見了,請重新輸入。

JAGag29458:對照表視界中未顯示空白欄

  • 問題為何?對照表視界未顯示空白欄。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

JAGag32176:使用 Mozilla 1.5 時,「自動刷新」按鈕會在第一次自動更新之後出現

  • 問題為何?在 Mozilla 1.5 中,首頁上的「自動刷新」按鈕只會在第一次自動更新後出現。此問題僅發生於 Mozilla 1.5 瀏覽器中。新版的 Mozilla 或其他任何支援的瀏覽器均不會發生此問題。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

JAGag31375:叢集延伸區中的 SGeSAP 不見了

  • 問題為何?您可能安裝或配置了 SGeSAP 延伸,但「延伸」頁籤並未在清單中顯示 SGeSAP。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

JAGag28015:重新啟動 clog 後啟用了所有下拉式功能表選項

  • 問題為何?重新啟動 clog 套件後,隨即啟用了所有下拉式功能表選項。當 clog 套件執行於其他不是正在執行 SMH (System Management Homepage) 的節點上時,便會發生此問題。

  • 如何解決?提供的修補程式為何?此問題無解決方案。

可列印版本
隱私權聲明 使用範圍與著作權聲明
© Hewlett-Packard Development Company, L.P.