回到網頁內容 臺灣-繁體中文
HP.com 首頁 產品資訊 支�#169;及驅動程式 解決方案 如何購買
» 聯絡 HP
進階選項
HP.com 首頁
HP Integrity Essentials 全域工作負載管理員 A.02.00.00.x 版適用於 HP-UX 11i v1 和 HP-UX 11i v2 第二版更新的版本與安裝需知: > 第 1 章. 

已知的問題與解決方案

» 

技術文件

PDF 格式的完整書籍
» 回饋意見
內容©韟像B開©l

 » 目錄

本節討論 HP gWLM  A.02.00.00.x 版的問題與解決方案。

昇級以分區為基礎的 SRD 時,需要重新找尋

問題 

如果您有下列其中一種以分區為基礎的 SRD:

  • 位於 npar 內,以 vpar 為基礎的 SRD

  • 使用隨機補充包,以 npar 為基礎的 SRD

而且又將分區內的 gWLM 代理程式從 gWLM A.01.x 昇級為 gWLM A.02.00.00.x,便無法將相同複合系統 (complex) 中的其他分區新增到 SRD 中。

解決方案 

使用 gWLM 的命令行介面重新建立 SRD:

  1. 部署 SRD 之後,重新找尋 SRD:

    若為以 vpar 為基礎的 SRD:

    # gwlm discover --type=vpar --file=/tmp/myfile.xml 主機

    若為以 npar 為基礎的 SRD:

    # gwlm discover --type=npar --file=/tmp/myfile.xml 主機

    其中主機是 SRD 中以空格隔開的分區清單。

  2. 視需要,確認 myfile.xml 中 sharedResourceDomain 元件的 mode 屬性設為 Managed (而非 Advisory):

    mode="Managed"

  3. 確認 sharedResourceDomain 元件的 interval 屬性設為您屬意的值,例如 x

    interval="x"

  4. 匯入檔案以重建 SRD:

    # gwlm import --file=/tmp/myfile.xml --clobber

    由於已經部署 SRD,新的 SRD 定義會在匯入時部署,並取代原本的 SRD。

SRD 監控時看不到受管理節點

問題 

與 CMS 失去通訊的受管理節點會從 Shared Resource Domain View 和 gwlm monitor 輸出中消失,且不會出現錯誤訊息。

解決方案 

檢查 gwlmagent 是否仍在執行,以及是否有網路問題。

Integrity VM 阻止找尋 psets 和 fss 群組

問題 

在已安裝 HP Integrity 虛擬機器 (Integrity VM) 的系統上安裝 gWLM 代理程式時,即便 pset 和 fss 群組存在,找尋作業仍只報告 Integrity VM 區間。

解決方案 

欲找尋系統上的 pset 或 fss 群組,需先解除安裝 Integrity VM。

找尋作業不會顯示已停止虛擬機器的最新資訊

問題 

gWLM 找尋作業不一定會報告已停止虛擬機器的最新資訊。明確地說,當虛擬機器停止且 vCPU 的數量已變更時,gWLM 找尋作業不會顯示變更的 vCPU 數量;而是顯示最近一次啟動虛擬機器時的 vCPU 數量。

解決方案 

執行找尋作業前,先啟動虛擬機器。

多張網路介面卡

問題 

比起其他類型的應用程式,屬於主從式應用程式的 gWLM 對於主機的網路配置較為敏感。gWLM 只支援單一網路網域內的管理動作。假如您的 CMS 主機具備多張網路介面卡並連線至多個不同網路,gWLM 便會要求完全合格的主機名稱以取得欲管理 gWLM 代理程式可到達的 IP 位址。

當主機連線到下列兩個項目時,通常會發生這個問題:

  • 透過一張網路介面卡和 IP 位址連線到公司區域網路/廣域網路

  • 用於與其他特定主機組 (例如叢集成員) 通訊的第二個專用內部網路和專用 IP 位址

gWLM 會試圖偵測和報告可能會造成意外行為的網路配置問題,不過有時候這類偵測的結果只能記錄在日誌檔中。

解決方案 

若發生意外行為 (例如 gWLM 代理程式無法更新或報告其工作負載狀態),請檢查主機的 /var/opt/gwlm/glwmagent.log.0 檔案有無錯誤。

主機名稱別名

問題 

gWLM 不支援主機名稱別名,只支援主機的標準 DNS 名稱 (完全合格的網域名稱)。

解決方案 

透過 HP Systems Insight Manager 或是使用 gwlm 命令編輯 XML 檔案配置 gWLM 時,僅使用標準的 DNS 名稱。

無法建置單一共享資源網域

問題 

在 gWLM 的 SIM 介面中看到下列訊息:

Unable to build a single shared resource domain from the set of specified hosts: 我的主機A.我的網域.com 我的主機B.我的網域.com

解決方案 

會出現這個訊息,通常是因為主機位於不同的複合系統中。若主機位於同一個複合系統,則請檢查這些主機上的 gWLM 代理程式版本。

gWLM 要求單一 SRD 內的所有代理程式必須為相同版本。請在 SRD 中的所有受管理節點上安裝相同版本的代理程式。

找尋區間時出現錯誤

問題 

使用 Manage New Systems 精靈或 gwlm discover 命令時,出現下列訊息:

Error during discovery of compartments.

而且您的 /var/opt/gwlm/gwlmagent.log.0 檔案顯示下列訊息:

com.hp.gwlm.common.PlatformException: /usr/sbin/parstatus -w exited with a non-zero exit status. Captured stderr is: Error: Unable to get the local partition number.

解決方案 

原因通常是因為 nPartition 軟體的版本過時。請安裝最新版的 nPartition 軟體 (即使您不使用 nPartition 亦然)。

若為 HP-UX 11i v1,請確認您安裝的是 B.11.11.01.03.01.01 版或更新版。

若為 HP 9000 上的 HP-UX 11i v2,請確認您安裝的是 B.11.23.01.03.01.01 版或更新版。

若為 HP Integrity 上的 HP-UX 11i v2,請確認您安裝的是 B.11.23.01.04 版或更新版。

您可以從下列位置取得此產品:

  • 自 2005 年 5 月起的每季 AR 光碟

  • 到 http://software.hp.com 搜尋「nPartition Provider」

(gWLM 使用此軟體 (通常每一版 HP-UX 均會隨附) 提供的命令來判斷系統能力)。

配置沒有同步化

問題 

有時候,gWLM 代理程式和 gWLM CMS 會對於是否已確實部署某 SRD 有不同的判斷。當您使用 ^C (Control-C) 中斷 gwlm deployundeploy 時,可能會出現此問題。此外,若在儲存 gWLM 配置時出現錯誤,也會發生此問題。配置會在部署後儲存到 gWLM 儲存庫中。若部署成功但儲存失敗,gWLM 代理程式會視為已部署 SRD,而 CMS 則否。

解決方案 

使用 --force 選項搭配 gwlm deploygwlm undeploy,重新同步化代理程式和 CMS。

例如,您可以執行下列重新同步化命令,強制代理程式和 CMS 同時將 SRD 視為已部署。

# /opt/gwlm/bin/gwlm deploy --srd=SRD --force

請將您的 SRD 名稱替換為 SRD

若需 gwlm 命令的相關資訊,請參閱 gwlm(1M) 線上援助頁。

已被鎖定

問題 

重複出現類似下列的訊息:

Unable to acquire the repository lock necessary to store changes. The lock is already held by: root(Tue Feb 08 13:11:08 CST 2005). Please retry your operation.

解決方案 

停止後再重新啟動 gwlmcmsd 即可清除鎖定,不過您必須等待一分鐘方能使用 gWLM:

附註: 停止 gwlmcmsd 便會停用 HP Integrity Essentials Virtualization Manager 和 HP Integrity Essentials Capacity Advisor。

# /opt/gwlm/bin/gwlmcmsd --stop

# /opt/gwlm/bin/gwlmcmsd

遺失或出現非預期的歷程資料

問題 

沒有可供記述圖的歷程資料;不過您確定在這段有問題的時間之內確實有部署 SRD。

還有一個類似的問題,就是在您選取預期系統活動高峰時段後,卻發現記述圖僅顯示有限的活動。同樣的,您也可能預期某時段的活動非常少,但是記述圖卻顯示許多活動。

解決方案 

檢查 CMS 和 SRD 所有系統上的系統時脈是否同步。若時脈差距甚大,gWLM 可能無法將來自受管理節點的資料與您欲記述的時段進行比對。

gwlmreport:報告啟動和 (或) 結束時遺失樣本

問題 

gwlmreport 送出報表的報告時段,是從報表開始的當天午夜零時開始,到報表結束當天的午夜十二點結束。報表排除任何與報表開始或結束午夜時段重疊的樣本。

解決方案 

沒有解決方案;不過您應該注意此行為。

日後版本會將這類樣本加入報表中。

將規則權重設為 0 造成不當配置 (Skewed Allocation)

問題 

規則權重可以在資源過多時,協助 gWLM 決定資源配置。當用於 SRD 的所有規則均設為相同的權重值時,資源應該會平均配置到相關的工作負載。然而,將 SRD 內所有規則的權重設為 0,會造成單一工作負載配置到所有過多資源。

解決方案 

使用 1 而非 0 作為權重值。

無法移除預設 (OTHER) 工作負載

問題 

試圖從 SRD 移除預設 (OTHER) 工作負載時,出現下列訊息:

Removal of all compartments from an SRD is not allowed

解決方案 

您無法從 SRD 移除預設 (OTHER) 工作負載。您只能解除部署 SRD。

日誌檔副檔名不是 .log.0、.log.1 和 .log.2

問題 

gWLM 設計使用 .log.0、.log.1 和 .log.2 作為日誌檔的副檔名,並使用 Java 鎖定檔案,確保在任何特定時間內,只能有一個 gWLM 處理程序更新日誌。從 Java 1.4.2.06 版開始的檔案鎖定功能允許以 .log.0.n 的副檔名格式建立檔案,其中 n 是某整數。

解決方案 

使用 java 1.4.2.06 版或更新版時,欲檢查日誌有無錯誤,請使用下列命令查看哪些檔案具有最新的錯誤訊息:

# /bin/ls -ltr /var/opt/gwlm/*log*

接著,您可以使用 /usr/bin/tail 檢視最近更新日誌檔的訊息。

若要傳送日誌檔給 HP 支援中心,請建立 tar 檔案:

# cd /

# tar cvf /tmp/gwlmlogs4support.tar var/opt/gwlm/*log*

然後,將 /tmp/gwlmlogs4support.tar 檔案傳送到支援中心。

彙聚率和 OwnBorrow/使用規則

問題 

當您在定義規則時選擇性指定的彙聚率值 (convergence rate),目前只會影響自訂規則。OwnBorrow 和使用規則不會受影響。

解決方案 

此問題將在日後的 gWLM 版本獲得解決。

...Unable to Create New Native Thread

問題 

您遇到包含下列文字的訊息:

...unable to create new native thread

解決方案 

這是因為特定核心程式參數設的太低。

  • max_thread_proc

    • 若為 psets 和 fss 群組:

      在 HP-UX 11 v1 上,將 max_thread_proc 至少設為 192 以上。

      在 HP-UX v2 第二版更新上,將 max_thread_proc 至少設為 768。

    • 若為 vpars:

      max_thread_proc 至少設為 768。

  • nkthread

    設定 nkthread 允許 max_thread_proc 值以及系統上其他所有處理程序所需的執行緒數量。

關於規則上限值超過區間上限值的錯誤警告

問題 

套用使用規則後,可能會出現下列格式的警告:

Policy maximum (x CPUs) is greater than compartment maximum (y CPUs). Using compartment maximum instead.

其中 x 實際上小於 y

解決方案 

您可以忽略此警告:gWLM 實際上會使用規則上限值。

如果您想要除掉警告,請對每則使用規則進行下列動作:

  1. 匯出規則

    假設規則名稱為 myUtilPol,請執行下列命令:

    # /opt/gwlm/bin/gwlm export --policy=myUtilPol \ --file=/tmp/myTmpPol

  2. 匯入規則

    # /opt/gwlm/bin/gwlm import --file=/tmp/myTmpPol --clobber

自訂量測標準在重新部署時遺失

問題 

自訂規則會使用您透過 gwlmsend 命令所提供的量測值。若您重新部署具有自訂規則的 SRD,該規則標準的最新值就會遺失。在此情況下,gWLM 會根據工作負載規則指定的最小要求進行其配置。工作負載還會接收符合所有規則後,依然存在的任何 CPU 資源。

解決方案 

請務必在重新部署後,立即更新所有自訂規則的量測標準值。

出現多個以虛擬分區為基礎的 SRD

問題 

gWLM 通常不允許您在同一時間,於單一 nPartition 或系統上建立多個以虛擬分區為基礎的 SRD。然而,當多位 gWLM 使用者幾乎在同時部署 SRD 時,gWLM 會不小心允許多個 SRD 存在。

解決方案 

刪除其中一個 SRD,然後重新管理刪除的 SRD 中的工作負載,將這些工作負載放到剩下來的 SRD 中。

無法部署共享資源網域

問題 

出現如下的錯誤訊息:

Unable to deploy Shared Resource Domain: system1.pset.000, due to: Error starting Compartment Manager. Please save file /var/opt/gwlm/gwlmagent.log.0 and contact HP technical support.

當您在建立 SRD 後試圖部署代表某系統的 SRD 時,若該系統上有空白的 pset (未指定 CPU 的 pset),就可能發生這個錯誤。

解決方案 

指定 CPU 至該 pset,或是移除該 pset,然後再建立並部署 SRD。

目前正在載入即時資料

問題 

當您試圖檢視即時報告時,可能會看到下列訊息:

Real-time data is currently loading, please wait...
You might also verify that the remote node is running and
SRDs have been deployed.
解決方案 

通常,這種狀況只是暫時性的。若持續發生,請檢查 gwlmagent 協助程式是否在遠端節點上執行。如果是,停止它後再重新啟動。若狀況依然存在,則請解除部署後再重新部署 SRD。

只允許部署單一 SRD

問題 

出現如下的訊息:

Error trying to deploy SRD, mysystem.vpar.000 to
mysystem2.mydomain.com. SRD, mysystem2.fss.000 is already
deployed. Only one SRD is allowed to be deployed.
解決方案 

使用 --force 選項搭配 gwlm undeploy 進行解除部署動作,然後在受管理節點上重新啟動 gwlmagent

SRD 監控作業可能懸滯

問題 

gWLM 未顯示 SRD 的監控更新資訊,不論是命令行或透過 HP SIM 中的圖形介面皆然。

解決方案 

原因可能是因為受管理節點關閉或是未執行它的 gwlmagent。若節點未關閉,但是代理程式不在執行中,那麼可使用有限的監控作業。要解決此問題,請在受管理節點上重新啟動 gwlmagent

FSS 群組中的應用程式懸滯

問題 

在 HP-UX 11i v2 (B.11.23) 中,當 fss 群組內的應用程式在單一處理器虛擬分區、nPartition 或系統中執行時,可能會懸滯。

解決方案 

安裝修補程式 PHKL_33052。

命令集未置於正確工作負載中

問題 

當區間以 pset 或 fss 群組為基礎時,gWLM 允許您將命令集放在使用具有替代名稱之應用程式記錄的區間中。只有在所使用的 shell 或編譯器列於 /etc/shells 檔案中時,才能這樣做。perl 通常不在此檔案中。因此,perl 命令集 (以及其他任何以 shell 或編譯器為基礎,且未列在 /etc/shells 中的命令集) 的放置位置不正確。

執行檔不受此問題影響。

解決方案 

將 /opt/perl/bin/perl 以及其他任何必要的 shell 或編譯器加入 /etc/shells 檔案中。gWLM 會在 30 秒之內識別新增的 shell 或編譯器。

附註: 由於命令集不需要完整的路徑名稱,不守規則的使用者 (或侵入者) 可以使用新命令集或封裝的命令集名稱存取以 pset 或 fss 群組為基礎的區間 (若不用此法便無法存取)。

處理程序移動到預設的 pset 或預設的 fss 群組

問題 

當您使用 gwlmplace 命令放置工作負載中的處理程序時,若發生下列任一事件,通常是因為處理程序移到預設的 pset 或預設的 fss 群組。

  • 受管理節點重新啟動

  • 本機 gwlmagent 協助程式重新啟動

  • 您解除部署目前的 SRD

  • 您部署一個 SRD

在這些情況下,處理程序的位置會根據任何適用的應用程式記錄或使用者記錄。若無記錄,處理程序則會遵循線上輔助說明主題「pset / fss group tips」中「Precedence of placement techniques」一節的配置規則。

解決方案 

要在重新部署後保留處理程序配置,請在建立或編輯 gWLM 中的工作負載定義時,使用 gWLM 的應用程式記錄或使用者記錄。

使用 psrset 的處理程序配置被忽略

問題 

當 gWLM 管理系統上的 psets 時,系統上的每個處理程序均必須進入工作負載。gWLM 會根據您在建立或編輯工作負載定義時所指定的應用程式記錄或使用者記錄,進行處理程序的配置。若無記錄,處理程序則會遵循線上輔助說明主題「pset / fss group tips」中「Precedence of placement techniques」一節的配置規則。

若您使用 psrset 將處理程序放入 pset,gWLM 很可能會將處理程序放到預設的 pset 中。

解決方案 

欲維護處理程序配置,請在建立或編輯 gWLM 中的工作負載定義時,使用 gWLM 的應用程式記錄或使用者記錄。若無法使用記錄,則請使用 gwlmplace 命令。不過,您必須在每次重新部署 SRD 後,使用 gwlmplace 將處理程序放回您要的工作負載中。

無法移除已棄置的 fss 群組

問題 

gWLM 建立的 fss 群組被棄置,且無法輕易移除。有多種狀況會造成這個問題。其中一種狀況是當您管理以 fss 群組為基礎的 SRD 時,使用了第二個 CMS;原因可能是因為原本的 CMS 已經關閉。這樣可能會讓 SRD 留下您無法移除的 fss 群組。

解決方案 

移除 fss 群組。

要移除該群組的方法有很多種。若已安裝 PRM,請執行下列命令:

# /opt/prm/bin/prmconfig -r

若未安裝 PRM,請執行下列 gWLM 命令:

  1. 執行找尋:

    # /opt/gwlm/bin/gwlm discover 主機 --file=myfile.xml \ --type=fss

    其中的主機是具有 fss 群組的主機

  2. 將 myfile.xml 匯入儲存庫:

    # /opt/gwlm/bin/gwlm import --file=myfile.xml

  3. 執行下列命令並檢查輸出中包含 主機 的名稱,以便判斷 SRD 名稱:

    # /opt/gwlm/bin/gwlm list

    假設名稱為主機.fss.xyz (其中 xyz 是 0-9 的數字)。

  4. 部署 SRD:

    # /opt/gwlm/bin/gwlm deploy --srd=主機.fss.xyz

    請用實際的 SRD 名稱代換「主機.fss.xyz

  5. 解除部署 SRD:

    # /opt/gwlm/bin/gwlm undeploy --srd=主機.fss.xyz

    請用實際的 SRD 名稱代換「主機.fss.xyz

此時,fss 群組應該已從系統中移除。不過,這些群組的工作負載定義仍保留在 gWLM 配置庫中。您可以用下列兩種方法之一,將這些定義和 SRD 定義自配置庫移除。

第一種方法是使用 HP Systems Insight Manager 中的 gWLM 介面來移除定義。請選取下列功能表:

Optimize 
 -> Global Workload Manager (gWLM) 
 -> Shared Resource Domains...

然後選取具有 fss 群組的 SRD,接著再選取 VSE Management 功能表列中的下列功能表:

Delete
 -> Shared Resource Domain

第二種方法是使用命令行:

  1. 執行下列命令,判斷 SRD 名稱和工作負載名稱:

    # /opt/gwlm/bin/gwlm list

    假設名稱為主機.fss.xyz (其中 xyz 是 0-9 的數字)。

  2. 刪除 SRD 定義,用實際的 SRD 名稱替換「主機.fss.xyz」:

    # /opt/gwlm/bin/gwlm delete --srd=主機.fss.xyz

  3. 重複下列命令替換各工作負載名稱,以便刪除工作負載定義:

    # /opt/gwlm/bin/gwlm delete --workload=主機.fssN.xyz

    其中 N 是 1 到系統上 fss 群組總數之間的數字。

可列印版本
隱私權聲明 使用範圍與著作權聲明
© 2004-2006 Hewlett-Packard Development Company, L.P.