Salta l'introduzione Italia - Italiano
HP.com Italia Prodotti e Servizi Supporto e Drivers Soluzioni Come Acquistare
» Contatta HP
Altre opzioni
HP.com Italia
Informazioni sulla release del software di amministrazione VSE versione A.02.50.00 > Capitolo 4 Problemi noti e risoluzioni

Informazioni sulla release aggiuntive di gWLM

» 

Documentazione tecnica

Libro completo in PDF
» Documenti correlati
» Feedback
Inizio contenuto

 » Sommario

 » Indice

Supporto di HP-UX 11iv3

La versione HP-UX 11i v3 dell'agente gWLM non supporta:

  • Abilitazione dell'hyperthreading

  • Operazioni in linea con le celle

Soluzione:  Disabilitare l'hyperthreading nei sistemi che si desidera amministrare con gWLM.

Per le operazioni in linea con le celle, interrompere la messa in attività del dominio di risorse condivise contenente i sistemi che si desidera modificare, eseguire le modifiche, quindi creare nuovamente il dominio di risorse condivise.

Compatibilità con i controlli esterni di CPU / sistema

È previsto che Global Workload Manager abbia il controllo completo delle CPU disponibili in un sistema. Alcune azioni eseguite dall'utente possono avere conseguenze negative sulla gestione di un sistema da parte di gWLM. Ad esempio:

  • Non modificare manualmente il conteggio delle CPU nei sistemi in cui gWLM è in esecuzione. Non modificare manualmente le risorse di Temporary Instant Capacity (TiCAP) – cioè non avviare o fermare le CPU di TiCAP – le risorse di Instant Capacity, le macchine virtuali, le partizioni virtuali, comprese le modifiche al binding delle CPU, o le nPartition.

  • Non modificare manualmente i diritti per le macchine virtuali. Inoltre, non modificare il numero di CPU virtuali di una macchina virtuale mentre gWLM la sta amministrando.

  • Non creare o eliminare un pset utilizzando psrset in un sistema in cui gWLM sta amministrando i compartimenti pset.

  • Non spostare la memoria da una partizione virtuale ad un'altra utilizzando vparmodify.

  • Non eseguire operazioni in linea con le celle utilizzando parolrad.

Soluzione: Se fosse necessario eseguire una qualsiasi di queste modifiche manuali, interrompere la messa in attività del dominio di risorse, eseguire le modifiche, quindi creare nuovamente il dominio di risorse condivise.

Compatibilità con Temporary Instant Capacity

Global Workload Manager è in grado di utilizzare TiCAP automaticamente. Nel caso che non siano disponibili risorse di CPU libere ed i criteri non siano soddisfatti, gWLM utilizzerà le risorse di TiCAP per soddisfare i criteri. Ciò avrà luogo solamente dopo avere assegnato tutte le risorse CPU possedute.

La gestione di Temporary Instant Capacity da parte di gWLM è attivata tramite una proprietà del dominio di risorse condivise in HP SIM, oppure tramite l'attributo ticapMode di un elemento sharedResourceDomain del file di configurazione XML di gWLM.

Non avviare o arrestare le CPU di TiCAP in un sistema attualmente amministrato da gWLM. Per ulteriori informazioni, consultare “Compatibilità con i controlli esterni di CPU / sistema”.

Compatibilità con HP Integrity Virtual Machines

Global Workload Manager è in grado di gestire i diritti per le macchine virtuali create con HP Integrity Virtual Machines A.02.00 o successive. Quando sono controllati da gWLM, i diritti di una macchina virtuale sono sostituiti con un'assegnazione delle CPU calcolata dinamicamente, che è dedicata esclusivamente a tale macchina virtuale, in base ai criteri gWLM in effetto. Alle macchine virtuali non è consentito un uso delle assegnazioni superiore a quello controllato da gWLM; nell'intervallo di assegnazione delle risorse, quelle non sfruttate diventano utilizzate.

Non modificare manualmente i diritti o il numero delle CPU virtuali delle macchine virtuali in un sistema amministrato da gWLM. Per ulteriori informazioni, consultare “Compatibilità con i controlli esterni di CPU / sistema”.

Global Workload Manager A.02.50.00 non è compatibile con le versioni di HP Integrity Virtual Machines precedenti alla versione A.02.00. Se si desidera amministrare le macchine virtuali con gWLM A.02.50.00, HP suggerisce di effettuare l'aggiornamento a HP Integrity Virtual Machines versione A.02.00 o successiva.

Soluzione:  Nel caso non sia possibile effettuare l'aggiornamento dalla versione A.01.20 di HP Integrity Virtual Machines, sarà necessario installare nel proprio host di macchine virtuali l'agente software gWLM versione A.02.00.00. In questo caso, non sarà possibile utilizzare le nuove funzionalità di gWLM A.02.50.00. Per ottenere la versione A.02.00.00 dell'agente gWLM e per l'assistenza con questa configurazione, contattare HP all'indirizzo e-mail .

Compatibilità con PRM e con WLM

Non è possibile utilizzare contemporaneamente gWLM con PRM – Process Resource Manager – né con WLM – Workload Manager – per gestire il medesimo sistema. Il tentativo di fare ciò restituirà un messaggio che segnala la presenza di un blocco mantenuto dall'applicazione che sta effettivamente amministrando il sistema. In questa situazione, prima di utilizzare gWLM è necessario chiudere l'applicazione che mantiene il blocco.

Con PRM, eseguire i comandi seguenti:

# /opt/prm/bin/prmconfig -d
# /opt/prm/bin/prmconfig -r

Con WLM, eseguire i comandi seguenti:

# /opt/wlm/bin/wlmd -k

L'aggiornamento di domini di risorse condivise basati su partizioni richiede un nuovo rilevamento

Se si sta utilizzando gWLM, disponendo di uno dei due tipi seguenti di domini di risorse condivise basati su partizioni e avendo effettuato l'aggiornamento degli agenti gWLM nelle partizioni, da gWLM A.01.x a gWLM A.02.50.00, non sarà possibile aggiungere al dominio di risorse condivise altre partizioni nello stesso complesso:

  • Un dominio di risorse condivise basato su vPar all'interno di una nPartition

  • Un dominio di risorse condivise basato su nPartition che utilizza Instant Capacity (iCAP)

Soluzione:  Per ripristinare il dominio di risorse condivise, utilizzare la procedura seguente nel server di amministrazione centrale:

  1. Rilevare nuovamente il dominio di risorse condivise appena messo in attività. Per un dominio di risorse condivise basato su vPar, eseguire il comando seguente:

    # /opt/gwlm/bin/gwlm discover --type=vpar \
      --file=/tmp/nome_file.xml nomi_host

    Per un dominio di risorse condivise basato su nPartition, eseguire il comando seguente:

    # gwlm discover --type=npar \
      --file=/tmp/nome_file.xml nomi_host

    In questi comandi, sostituire nomi_host con un elenco di partizioni, separate da uno spazio, che si trovano nel dominio di risorse condivise.

  2. Eseguire le seguenti modifiche al file /tmp/nome_file.xml, seguendo le istruzioni contenute in gwlmxml(4):

    • Assicurarsi che l'attributo mode dell'elemento sharedResourceDomain sia configurato nel modo desiderato (Managed o Advisory):

      mode="Managed"

    • Assicurarsi che l'attributo interval dell'elemento sharedResourceDomain sia configurato nel modo desiderato:

      interval="x"

    • Assicurarsi che l'attributo ticapMode dell'elemento sharedResourceDomain sia configurato come all se gWLM deve assegnare Temporary Instant Capacity quando necessario:

      ticapMode="all"

    • Assicurarsi che le voci workloadReference nelle definizioni di compartimento siano corrette e adattare i nomi delle definizioni stesse del carico di lavoro. Ad esempio, potrebbe esserci host.OTHER.2 invece di host.OTHER.

  3. Importare il file per creare nuovamente il dominio di risorse condivise:

    # gwlm import --file=/tmp/nome_file.xml --clobber

    Dato che il dominio di risorse condivise era già stato messo in attività, la sua nuova definizione sarà distribuita durante l’importazione, prendendo il posto di quella originale.

Installazione non riuscita dell'agente gWLM in Linux

L'installazione del pacchetto gWLM-Agent può fallire con la restituzione di un codice 1, senza ulteriori messaggi di errore, nelle seguenti condizioni:

  • L'agente gWLM non è in grado di copiare il file gwlmCtl in /etc/sysconfig/gwlmCtl

  • L'agente gWLM non è in grado di determinare la directory rc corretta che deve essere utilizzata (/etc/rc.d/init.d o /etc/init.d)

  • L'agente gWLM non è in grado di determinare la directory JAVA_HOME corretta da utilizzare in /usr/java.

  • L'agente gWLM non è stato in grado di creare un collegamento alla directory JAVA_HOME

Soluzione:  Contattare il proprio rappresentante commerciale HP, il proprio rappresentante per i servizi HP, oppure il proprio rivenditore autorizzato HP. Per maggiori informazioni sui servizi d’assistenza, visitare il sito Web di assistenza, all'indirizzo http://welcome.hp.com/country/it/it/support.html.

Uso costante delle risorse di Temporary Instant Capacity

Global Workload Manager è in grado di attivare Temporary Instant Capacity, se questo è necessario per soddisfare i criteri del dominio di risorse condivise. Per evitare il consumo non necessario di TiCAP, è necessario disporre di un numero sufficiente di CPU con licenze senza scadenza. Se il proprio dominio di risorse condivise è più grande di questo numero, per soddisfare le richieste del dominio di risorse condivise sarà consumata della capacità temporanea.

Soluzione:  Disattivare le risorse TiCAP prima di creare un dominio di risorse condivise. Qualsiasi risorsa TiCAP attiva in questo momento sarà inclusa nel dominio di risorse condivise e sarà perciò consumata quando sarà messo in attività.

Processore della cella locale e ambiente iCAP

L'uso di processori della cella locale in un ambiente Instant Capacity (iCAP) causa errori con icod_modify.

Soluzione:  Prendere in considerazione l'assegnazione di CPU alle partizioni virtuali utilizzando un percorso hardware. Tuttavia, non assegnare CPU utilizzando identificazioni della cella.

L'amministrazione di nPartition con iCAP B.08.00 richiede un bilancio positivo TiCAP

Global Workload Manager utilizza iCAP per amministrare le nPartition. Con iCAP B.08.00, i tentativi di gWLM di modificare le risorse iCAP non avranno successo se il sistema non ha un bilancio positivo di Temporary Instant Capacity (TiCAP).

Soluzione:  Assicurarsi che i sistemi che eseguono iCAP B.08.00 abbiano un bilancio TiCAP positivo (sia del tempo TiCAP sia delle risorse CPU).

Più domini di risorse condivise in un complesso sono autorizzati a usare TiCAP

Global Workload Manager consente a più domini di risorse condivise in un complesso di usare TiCAP; si dovrebbe però impedire che questa situazione si verifichi.

Soluzione: Non configurare i domini di risorse condivise in questo modo.

Amministrazione di partizioni virtuali annidate in una nPartition

In un dominio di risorse condivise che amministra partizioni virtuali annidate in una nPartition, potrebbero essere visualizzate informazioni sullo stato che indicano un avviso di attenzione importante nella schermata Shared Resource Domain View. L'avviso indica che l'assegnazione di CPU è maggiore della dimensione del dominio di risorse condivise.

Soluzione: Amministrare tutte le partizioni virtuali nella nPartition.

Sovrascrittura del file gwlmcms.properties

Il file /etc/opt/gwlm/conf/gwlmcms.properties è sovrascritto quando si esegue il comando vseinitconfig.

Soluzione:  Il comando vseinitconfig utilizza il file /etc/opt/gwlm/conf/gwlmcms.template per creare il file gwlmcms.properties. Nel caso si modificasse il file gwlmcms.properties, modificare allo stesso modo il file gwlmcms.template.

La modifica della configurazione di un dominio di risorse condivise di grande dimensione richiede molto tempo

Le modifiche alla configurazione di un dominio di risorse condivise di grande dimensione messo in attività potrebbero richiedere molto tempo (diversi minuti) per avere effetto.

Soluzione:  Non ci sono soluzioni. Il tempo necessario per completare le modifiche dipende da quello necessario per comunicare con tutti i compartimenti del dominio di risorse condivise.

Le nPartition non sono amministrabili anche se l'opzione è visualizzata

Global Workload Manager consente di amministrare i carichi di lavoro basati su compartimenti diversi. Se un tipo di compartimento non è disponibile in un complesso, gWLM usualmente non presenta quel tipo come candidato all'amministrazione. Tuttavia, l'interfaccia gWLM di HP SIM presenta sempre la nPartition come tipo potenziale di compartimento, anche se nel sistema non vi sono risorse iCAP disponibili. Questo non causa problemi, ma se è selezionato quel tipo di compartimento, gWLM non è in grado di svolgere l'amministrazione delle risorse.

Soluzione:  Non cercare di utilizzare i compartimenti nPartition a meno che nel complesso siano disponibili risorse di HP Instant Capacity.

L'installazione di una versione più recente dell'agente gWLM in un server di amministrazione centrale meno recente rende il sistema inutilizzabile

È possibile installare una versione più recente dell'agente gWLM in un server di amministrazione centrale che usa una versione precedente di gWLM. Ad esempio, è possibile installare l'agente A.02.50.00 in un sistema con la versione A.02.00.00.x del server di amministrazione centrale. Questa configurazione non è valida e rende il sistema inutilizzabile.

Soluzione:  Aggiornare la versione del server di amministrazione centrale. L'aggiornamento installa anche l'agente corrispondente.

L'eliminazione di carichi di lavoro può richiedere tempi relativamente lunghi

Una volta emessa una richiesta d'eliminazione di un carico di lavoro, potrebbe essere necessario un tempo relativamente lungo (diversi minuti) per portare a termine la cancellazione.

Soluzione:  Rimuovere dal database di gWLM i vecchi dati cronologici di monitoraggio e configurazione, eseguendo il comando seguente:

# gwlm history --truncate --truncate=<AAAA/MM/GG>

Nel caso non si desideri limitare il database, è possibile eliminare più carichi di lavoro simultaneamente, con il comando gwlm delete.

Per ulteriori informazioni, consultare gwlm(1M).

Integrity VM impedisce la rilevazione di pset e dei gruppi FSS

Quando l’agente gWLM è installato in un sistema con installato HP Integrity Virtual Machines – Integrity VM – le operazioni di rilevamento segnalano solamente i compartimenti di Integrity VM, anche se sono presenti pset e gruppi FSS.

Soluzione:  Per rilevare i pset o i gruppi FSS nel sistema, è necessario disinstallare Integrity VM.

È possibile aggiungere al dominio di risorse condivise soltanto i carichi di lavoro con carichi amministrati correlati

Con l'interfaccia a riga dei comandi di gWLM, non è possibile aggiungere un carico di lavoro al dominio di risorse condivise con una partizione annidata, a meno che un carico correlato non sia già amministrato nel dominio di risorse condivise.

Soluzione:  Il problema non si verifica utilizzando l'interfaccia gWLM di HP SIM. Seguire semplicemente le istruzioni del Punto 1 della procedura guidata "Manage Systems and Workloads" (utilizzabile selezionando Create->Shared Resource Domain) e scegliere l'insieme di host che devono essere compresi in un unico dominio di risorse condivise.

Impossibilità di rimuovere un carico di lavoro da un dominio di risorse condivise a partizioni annidate

Nel tentativo di rimuovere da un dominio di risorse condivise con partizioni annidate l'ultimo gruppo FSS [predefinito], potrebbe essere visualizzato un messaggio che comprende il testo seguente:

Unable to remove workload nome_carico_lavoro: Attempting to remove a compartment with an unachievably low Fixed policy size. Increase the Fixed policy resource amount and try again.

Soluzione:  Interrompere l'attività del dominio di risorse condivise ed eliminarlo. Creare quindi un nuovo dominio di risorse condivise senza il gruppo FSS che si tentava di rimuovere.

Dimensione non aggiornata di una nPartition se si utilizzano partizioni annidate

Durante il monitoraggio di un dominio di risorse condivise con partizioni virtuali in una nPartition di un sistema HP-UX 11i v1, la dimensione monitorata della nPartition potrebbe non essere aggiornata.

Soluzione:  Nessuna azione è necessaria. In un sistema HP-UX 11i v1, ignorare il valore visualizzato della dimensione della nPartition in un dominio di risorse condivise con partizioni annidate.

Amministrazione di gruppi FSS nei sistemi con pset che limitano i gruppi FSS

Quando in un sistema sono utilizzati i pset, per i gruppi FSS gWLM usa solamente il pset 0. gWLM è solamente in grado di amministrare le CPU assegnate al pset 0.

Soluzione:  Non c'è soluzione; questa è la modalità di implementazione dei gruppi FSS in un sistema che utilizza i pset. È possibile continuare a utilizzare i gruppi FSS nel pset 0, lasciando gli altri pset non amministrati, amministrare utilizzando invece i pset, ignorando i gruppi fss, oppure rimuovere tutti i pset, diversi quello 0, con il comando seguente:

# psrset -d

Il rilevamento non mostra le informazioni aggiornate delle macchine virtuali arrestate

Il rilevamento di Global Workload Manager non segnala sempre le informazioni aggiornate delle macchine virtuali arrestate. In particolare, quando una macchina virtuale è arrestata ed è stato modificato il numero di vCPU, il rilevamento fatto da gWLM non mostra il nuovo numero di vCPU. Segnala invece il numero di vCPU del più recente avvio della macchina virtuale.

Soluzione:  Avviare la macchina virtuale prima di eseguire la rilevazione.

Schede di rete multiple

In quanto applicazione client/server, gWLM è maggiormente sensibile, rispetto ad altri tipi di applicazioni, alla configurazione di rete del proprio host. gWLM supporta l'amministrazione soltanto all'interno di un singolo dominio di rete. Se, ad esempio, il proprio host del server di amministrazione centrale ha più schede di rete connesse a più reti distinte tra loro, gWLM richiede che il nome host completamente qualificato sia convertito nell'indirizzo IP che sarà raggiungibile dagli agenti gWLM da amministrare.

Questo problema è sovente fastidioso quando un host è connesso ad entrambi i soggetti seguenti:

  • Una LAN/WAN aziendale tramite una scheda di rete ed un indirizzo IP

  • Una seconda rete privata interna ed un indirizzo IP privato, per comunicare con un certo gruppo di host (come i membri di un cluster)

Global Workload Manager tenta di rilevare e di segnalare i problemi di configurazione di rete che possono essere causa di funzionamenti indesiderati, ma, in alcuni casi, il rilevamento avviene in un contesto che può essere segnalato solamente in un file di log.

Soluzione:  In caso di comportamenti imprevisti – come un agente gWLM che non riesce ad eseguire un aggiornamento o un rapporto dello stato dei suoi carichi di lavoro – esaminare il file /var/opt/gwlm/glwmagent.log.0 dell'host per eventuali errori.

Gli alias dei nomi host non sono supportati

gWLM non supporta gli alias dei nomi host. Sono supportati solamente i nomi host DNS canonici (nomi di dominio completamente qualificati).

Soluzione:  Quando si configura gWLM con HP SIM, oppure con un file XML utilizzato dal comando gwlm, usare solamente nomi DNS canonici.

Nomi host limitati a 64 caratteri

I nomi host non possono avere lunghezza superiore a 64 caratteri.

Soluzione:  Per utilizzare nomi host estesi, fino a 256 caratteri, installare JRE 1.4.2.07.

Impossibile realizzare un dominio di risorse condivise

Il seguente messaggio potrebbe essere visualizzato nell'interfaccia gWLM di HP SIM:

Unable to build a single shared resource domain from the set of specified hosts: nome_host_A.nome_dominio.com nome_host_B.nome_dominio.com

Soluzione:  Questo messaggio è in genere dovuto a degli host che si trovano in complessi differenti. Se però gli host sono nel medesimo complesso, controllare le versioni degli agenti gWLM in questi host.

Global Workload Manager richiede che tutti gli agenti all'interno di un singolo dominio di risorse condivise siano della medesima versione. Installare la stessa versione dell'agente in tutti i nodi amministrati del dominio di risorse condivise.

Errore durante il rilevamento dei compartimenti

Il seguente messaggio potrebbe essere visualizzato quando si usa la procedura guidata "Manage New Systems" o il comando gwlm discover:

Error during discovery of compartments.

Inoltre, il file /var/opt/gwlm/gwlmagent.log.0 conterrà il seguente messaggio:

com.hp.gwlm.common.PlatformException: /usr/sbin/parstatus -w exited with a non-zero exit status. Captured stderr is: Error: Unable to get the local partition number.

Soluzione:  La causa più probabile è la presenza di una versione superata del software per le nPartition. Per stabilire le capacità del sistema, Global Workload Manager utilizza un comando fornito dal software nPartition, che è presente in ogni versione di HP-UX. Installare la versione più recente del software per le nPartition, anche se non le si utilizza.

HP-UX 11i v1 richiede la versione B.11.11.01.03.01.01 o successiva.

Con HP-UX 11i v2 in HP 9000, è necessario utilizzare la versione B.11.23.01.03.01.01 o successiva.

Con HP-UX 11i v2 in HP Integrity, è necessario utilizzare la versione B.11.23.01.04 o successiva.

Il software nPartition è reperibile:

  • nel CD AR trimestrale, a partire da maggio 2005

  • nel sito Software Depot http://software.hp.com (cercare “nPartition Provider”)

Configurazione non sincronizzata

Occasionalmente, un agente gWLM ed il server di amministrazione centrale gWLM possono non essere d’accordo se un dominio di risorse condivise è stato effettivamente messo in attività. Questo può verificarsi quando si utilizza Ctrl-C per interrompere il comando gwlm deploy o il comando undeploy. Può verificarsi anche in caso di errori durante il salvataggio di una configurazione di gWLM. La configurazione è messa in attività, quindi salvata nell'archivio delle configurazioni gWLM. Nel caso che avvenga la messa in attività, ma non il salvataggio, l'agente gWLM considererà il dominio di risorse condivise come in attività, mentre il server di amministrazione centrale lo considererà come non in attività.

Soluzione:  Utilizzare l'opzione --force con gwlm deploy oppure con gwlm undeploy per sincronizzare nuovamente l'agente ed il server di amministrazione centrale.

Ad esempio, per forzare sia l'agente sia il server di amministrazione centrale a considerare il dominio di risorse condivise come in attività, eseguire il comando seguente, sostituendo a dominio_risorse_condivise il nome del proprio dominio:

# /opt/gwlm/bin/gwlm deploy --srd=dominio_risorse_condivise --force

Per maggiori informazioni sul comando gwlm, consultare gwlm(1M).

Presenza di un blocco

È ripetutamente visualizzato un messaggio simile a uno dei seguenti:

  • Unable to acquire the repository lock necessary to store changes. The lock is already held by: root(Tue Feb 08 13:11:08 CST 2005). Please retry your operation.

  • Unable to acquire the repository lock necessary to store changes. The lock is already held by: gWLM Agent on host: nome_host/indirizzo_IP (Wed May 24 13:20:32 EDT 2006). Please retry your operation.

Soluzione:  È possibile rimuovere il blocco arrestando e riavviando gwlmcmsd, anche se sarà necessario attendere fino ad un minuto prima di poter utilizzare gWLM. Usare i comandi seguenti:

# /opt/gwlm/bin/gwlmcmsd --stop
# /opt/gwlm/bin/gwlmcmsd

NOTA: L'arresto di gwlmcmsd disattiva Virtualization Manager e Capacity Advisor.

Dati cronologici mancanti o inattesi

Potrebbero non essere disponibili dati cronologici per i grafici – anche si è sicuri che nel lasso di tempo in questione è stato messo in attività un dominio di risorse condivise.

Un problema correlato si verifica quando si seleziona un periodo in cui ci si aspetta un'elevata attività del sistema, ma il grafico mostra un'attività limitata. Analogamente, ci si aspetta un'attività minima in un dato lasso di tempo, ma il grafico mostra un'attività elevata.

Soluzione:  Controllare che l'orologio di sistema del server di amministrazione centrale e quelli di tutti i domini di risorse condivise siano sincronizzati. Se gli orologi segnano orari decisamente diversi, gWLM potrebbe non essere in grado di far coincidere i dati dei nodi amministrati con il periodo di cui si desidera il grafico.

Caricamento in corso dei dati in tempo reale

Tentando di visualizzare dei rapporti in tempo reale, si riceve il messaggio seguente:

Real-time data is currently loading, please wait... You might also verify that the remote node is running and SRDs have been deployed.

Soluzione:  Questa situazione è di norma solo temporanea. Se dovesse persistere, controllare che il daemon gwlmagent sia in esecuzione nei nodi remoti. Se è in esecuzione, fermarlo e riavviarlo. Nel caso che tale situazione persista, interrompere e ripetere la messa in attività del dominio di risorse condivise.

Dati mancanti nel monitoraggio in tempo reale

Global Workload Manager potrebbe non aggiornare il monitoraggio di un dominio di risorse condivise – nella riga dei comandi oppure tramite l'interfaccia grafica in HP SIM. Questo può essere causato da un timeout durante i tentativi di riformare un dominio di risorse condivise, lasciandolo in uno stato in cui è necessario riavviare l'agente in ognuno dei suoi nodi amministrati. Una causa possibile può essere l'inattività di un nodo amministrato, la mancata esecuzione di gwlmagent nel nodo, oppure il blocco del nodo.

Se il nodo amministrato è inattivo o gwlmagent non è in esecuzione, sarà visualizzato il seguente messaggio:

The gWLM agent process on the host is not running -- start the agent and retry.

Se il nodo amministrato è bloccato o il dominio di risorse condivise richiede il riavvio di tutti i suoi agenti, i sintomi possono comprendere:

  • L'output del comando gwlm monitor omette i dati di alcuni domini di risorse condivise

  • La schermata Shared Resource Domain View in HP SIM visualizza diversi domini di risorse condivise con l'errore critico "SRD data is currently stale".

Soluzione:  Se un dominio di risorse condivise non offre monitoraggio in tempo reale per un periodo di tempo prolungato, riavviare l'agente gWLM in ogni nodo amministrato del dominio di risorse condivise.

Nel caso di un blocco anomalo di un membro del dominio di risorse condivise, mentre il monitoraggio in tempo reale del dominio è bloccato, gli altri domini di risorse condivise continuano ad amministrare risorse. Tuttavia, il monitoraggio in tempo reale di altri domini di risorse condivise potrebbe essere bloccato a causa del blocco anomalo del membro del dominio di risorse condivise. Per ripristinare il monitoraggio degli altri domini di risorse condivise:

  1. Interrompere la messa in attività del dominio di risorse condivise che contiene il membro bloccato. Questo potrebbe richiedere l'uso dell'opzione --force del comando gwlm undeploy.

  2. Riavviare gwlmcmsd per azzerare il monitoraggio bloccato, usando i comandi seguenti nel server di amministrazione centrale:

          # gwlmcmsd --stop
          # gwlmcmsd
          
  3. Creare un nuovo dominio di risorse condivise per sostituire il dominio non in attività, lasciando al di fuori il membro bloccato del dominio.

  4. Una volta che sia stata ripristinata la normale operatività del membro del dominio di risorse condivise che era bloccato, arrestare l'attività del dominio sostitutivo e rimettere in attività quello originale, in modo da tornare allo stato iniziale.

Campione mancante all'inizio o alla fine del rapporto di gwlmreport

Un rapporto di gwlmreport è basato su un periodo che parte da mezzanotte di un dato giorno e termina la mezzanotte del giorno seguente. Qualsiasi campione che si sovrappone all’ora iniziale oppure a quella finale del periodo sarà escluso dal rapporto.

Soluzione:  Non esiste una soluzione, ma è necessario essere a conoscenza di questo fatto.

Impostando a zero il criterio per weight porta ad un’assegnazione sbilanciata

Questo problema interessa solamente gli agenti gWLM A.02.00.00.x.

I valori di weight per i criteri consentono a gWLM di stabilire l’assegnazione delle risorse in caso di loro eccesso. Impostando al medesimo valore tutti i criteri per weight utilizzati in un dominio di risorse condivise, le risorse dovrebbero essere assegnate ai carichi di lavoro associati un modo bilanciato. Tuttavia, in un dominio di risorse condivise, impostando a zero tutti i criteri farà sì che ad un singolo carico di lavoro siano assegnate tutte le risorse in eccesso.

Soluzione:  Invece di zero, usare un valore di weight pari a uno.

Un carico di lavoro con criteri fissi ottiene maggiori risorse di quelle richieste

In un dominio di risorse condivise con partizioni annidate, assegnando criteri fissi in cui la somma dei valori fissi è inferiore al minimo del compartimento di livello superiore, può far sì che il carico di lavoro riceva più risorse di quelle specificate dai criteri fissi.

Soluzione:  Impostare i criteri fissi in modo tale che il numero di CPU necessarie sia superiore o uguale al numero minimo di CPU richieste dal compartimento di livello superiore.

Criteri per il tasso di convergenza e OwnBorrow/Utilizzo

Questo problema interessa sia gli agenti gWLM A.01.01.x sia quelli gWLM A.02.00.00.x.

Il valore per il tasso di convergenza specificabile facoltativamente quando di definisce un criterio, attualmente ha effetto solo sui criteri personalizzati. I criteri per OwnBorrow e l’utilizzo non ne sono influenzati.

Soluzione:  Non ci sono soluzioni. Tuttavia, negli agenti gWLM A.02.00.01.x questo problema è stato risolto.

Metriche personalizzate perdute nelle ripetizione della messa in attività

I criteri personalizzati utilizzano dei valori metrici forniti tramite il comando gwlmsend. Ripetendo la messa in attività di un dominio di risorse condivise che abbia un criterio personalizzato, il valore più recente della metrica del criterio va perduto. In tale situazione, gWLM basa le sue assegnazioni sulla richiesta minima specificata nel criterio del carico di lavoro. Il carico di lavoro può ricevere le risorse di CPU rimanenti dopo che tutti i criteri sono stati soddisfatti.

Soluzione:  Aggiornare i valori metrici di tutti i propri criteri personalizzati immediatamente dopo una ripetizione della messa in attività.

Impossibile creare un nuovo thread nativo

Potrebbe essere visualizzato un messaggio contenente il testo seguente:

...unable to create new native thread

Soluzione:  Questo problema si verifica perché i seguenti parametri del kernel sono impostati con valori troppo bassi:

  • max_thread_proc

    • Per i pset ed i gruppi FSS:

      Con HP-UX 11 v1, impostare max_thread_proc ad almeno 192.

      Con HP-UX 2 v2 settembre 2004 e successive, impostare max_thread_proc ad almeno 768.

    • Per le partizioni virtuali:

      Impostare max_thread_proc ad almeno 768.

  • nkthread

    Impostare nkthread adeguatamente al valore di max_thread_proc, così come per il numero di thread necessari agli altri processi del sistema.

Possono esserci più domini di risorse condivise basati su partizioni virtuali

In genere, gWLM non consente, in una singola nPartition o in un singolo sistema, la creazione nello stesso momento di più domini di risorse condivise basati su partizioni virtuali. Tuttavia, quando più utenti gWLM mettono in attività quasi nello stesso momento più domini di risorse condivise, gWLM potrebbe inavvertitamente consentire questi domini multipli.

Soluzione:  Eliminare uno dei domini di risorse condivise, quindi gestire nuovamente i carichi di lavoro del dominio appena eliminato, collocandoli in quello rimanente.

Impossibile mettere in attività il dominio di risorse condivise

Potrebbe essere visualizzato un messaggio simile al seguente:

Unable to deploy Shared Resource Domain: system1.pset.000, due to: Error starting Compartment Manager. Please save file /var/opt/gwlm/gwlmagent.log.0 and contact HP technical support.

Questo errore può verificarsi se in un sistema è presente un pset vuoto – un pset senza CPU ad esso assegnate – quando si crea e si tenta di mettere in attività un dominio di risorse condivise che comprende il sistema.

Soluzione:  Assegnare delle CPU al pset, oppure rimuoverlo, quindi ripetere la creazione e la messa in attività del dominio di risorse condivise.

NOTA: Global Workload Manager versione C.02.50.00.x impedisce la creazione di un dominio di risorse condivise che comprende un sistema con un pset vuoto; tuttavia, se si dispone di una versione precedente di gWLM, tale dominio potrebbe essere stato creato con quella versione.

È possibile mettere in attività solamente un dominio di risorse condivise

Potrebbe essere visualizzato un messaggio simile al seguente:

Error trying to deploy SRD, nome_sistema.vpar.000 to nome_sistema_2.nome_dominio.com. SRD, nome_sistema_2.fss.000 is already deployed. Only one SRD is allowed to be deployed.

Soluzione:  Nel nodo amministrato, interrompere la messa in attività utilizzando l'opzione --force con il comando gwlm undeploy e riavviare gwlmagent.

Blocco anomalo di un'applicazione in un gruppo FSS

Con HP-UX 11i v2 (B.11.23), un'applicazione all'interno di un gruppo FSS potrebbe bloccarsi quando è eseguita in una partizione virtuale, nPartition, o sistema a singolo processore.

Soluzione: Installare la patch PHKL_33052.

Script non collocati nei carichi di lavoro corretti

Con i compartimenti basati su pset o gruppi FSS, gWLM consente di collocare gli script in questi compartimenti, utilizzando dei record di applicazioni con nomi alternativi. Questo funziona solamente se la shell – o interprete – utilizzata è elencata nel file /etc/shells. In genere, perl non è contenuto in questo file. Gli script perl – ed altri script basati su shell o interpreti non elencati in in /etc/shells – non sono perciò collocati correttamente.

Questo problema non riguarda gli eseguibili.

Soluzione:  Aggiungere /opt/perl/bin/perl e qualsiasi altra shell o interprete, al file /etc/shells. Global Workload Manager riconoscerà le shell e gli interpreti aggiunti entro 30 secondi.

NOTA: Dato che per lo script non è necessario il percorso completo, un utente malintenzionato potrebbe ottenere l'accesso ai compartimenti basati sui pset o i gruppi FSS – che altrimenti non sarebbero accessibili – utilizzando il nome dello script per nuovi script e wrapper.

Processi spostati al pset o gruppo FSS predefinito

Tutte le assegnazioni dei processi eseguite con il comando gwlmplace in un nodo amministrato andranno perse se:

  • Il nodo amministrato è stato riavviato.

  • È stato riavviato il daemon gwlmagent.

  • È stata interrotta l’attività del dominio di risorse condivise corrente.

In questi casi, i processi saranno collocati secondo i record delle applicazioni, oppure secondo i record utente validi. Se non esistono record, i processi non di root sono collocati nei pset o nei gruppi FSS predefiniti; i processi di root sono lasciati dove si trovano.

Soluzione:  Per conservare la collocazione dei processi attraverso la ripetizione della messa in attività, in gWLM, durante la creazione o la modifica delle definizioni dei carichi di lavoro utilizzare i record delle applicazioni o quelli degli utenti di gWLM.

È ignorata la collocazione dei processi utilizzando psrset

Quando gWLM gestisce i pset in un sistema, ogni processo del sistema deve andare ad un carico di lavoro. gWLM colloca i processi secondo i record delle applicazioni o degli utenti, specificati al momento delle creazione o della modifica della definizione del carico di lavoro. Nel caso non esistano record, i processi sono soggetti alle regole di collocazione, descritte nella guida in linea, in "pset / fss group tips", nella sezione "Precedence of placement techniques".

Utilizzando il comando psrset per la collocazione dei processi nei pset, gWLM molto probabilmente sposterà i processi nel pset predefinito.

Soluzione:  Per conservare la collocazione di un processo, in gWLM, durante la creazione o la modifica delle definizioni dei carichi di lavoro utilizzare i record delle applicazioni o quelli degli utenti di gWLM. Se l'utilizzo dei record non è pratico, utilizzare il comando gwlmplace. Tuttavia, sarà necessario utilizzare gwlmplace ogni volta che sarà ripetuta la messa in attività di un dominio di risorse condivise, per riportare il processo nel carico di lavoro desiderato.

Impossibile rimuovere i gruppi FSS abbandonati

I gruppi FSS creati da gWLM possono diventare abbandonati e non è possibile rimuoverli facilmente. Questa situazione si verifica per diverse ragioni. Un caso è quando gestendo un dominio di risorse condivise basato sui gruppi FSS, è utilizzato un secondo server di amministrazione centrale, per esempio a causa dell'inattività del primo. Ciò può lasciare il dominio di risorse condivise con dei gruppi FSS che non è possibile rimuovere.

Soluzione: Rimuovere i gruppi FSS.

Per rimuovere i gruppi, ci sono varie possibilità. Se è installato PRM, eseguire il comando seguente:

# /opt/prm/bin/prmconfig -r

Se non è installato PRM, eseguire la seguente procedura:

  1. Eseguire la rilevazione:

    # /opt/gwlm/bin/gwlm discover nome_host --file=nome_file.xml \
      --type=fss

    dove nome_host è il sistema con i gruppi FSS.

  2. Importare il file nome_file.xml nell'archivio delle configurazioni:

    # /opt/gwlm/bin/gwlm import --file=nome_file.xml

  3. Accertare il nome del dominio di risorse condivise, eseguendo i seguenti comandi ed esaminando l'output per i nomi che contengono nome_host:

    # /opt/gwlm/bin/gwlm list

    Ad esempio, il nome potrebbe essere nome_host.fss.xyz (dove xyz sono numeri da 0 a 9).

  4. Mettere in attività il dominio di risorse condivise:

    # /opt/gwlm/bin/gwlm deploy --srd=nome_host.fss.xyz

  5. Interrompere l'attività del dominio di risorse condivise:

    # /opt/gwlm/bin/gwlm undeploy --srd=nome_host.fss.xyz

I gruppi FSS ora dovrebbero essere stati eliminati dal sistema. Tuttavia, le loro definizioni dei carichi di lavoro si troveranno ancora nell'archivio delle configurazioni di gWLM. È possibile rimuovere queste definizioni e le definizioni dei domini di risorse condivise, utilizzando l'interfaccia gWLM di HP SIM. Scegliere Tools->VSE Management, quindi fare clic sulla scheda Shared Resource Domain. Scegliere il dominio di risorse condivise nel gruppo FSS, quindi scegliere Delete->Shared Resource Domain.

Impossibile rimuovere il carico di lavoro predefinito (OTHER)

Tentando di rimuovere da un dominio di risorse condivise il carico di lavoro predefinito (OTHER), è restituito il messaggio:

Removal of all compartments from an SRD is not allowed

Soluzione:  Non è possibile rimuovere dal dominio di risorse condivise il carico di lavoro predefinito (OTHER). È necessario invece interrompere l'attività del dominio di risorse condivise.

Dimensioni/assegnazioni inferiori ai valori minimi dei criteri per le macchine virtuali

Le dimensioni o le assegnazioni per le macchine virtuali in un dominio di risorse condivise in attività potrebbero sembrare inferiori ai valori minimi dei loro criteri.

Soluzione:  Attendere alcuni minuti, dato che potrebbe essere necessario del tempo prima che gWLM riconosca la transizione di una macchina virtuale dallo stato di arrestata a quello di avviata.

Dimensione corrente negativa di NONVM

Se le CPU in un host di macchine virtuali sono assegnate in numero eccessivo quando si mette in attività un dominio di risorse condivise in quell'host, gWLM presenta la dimensione corrente di NONVM come valore negativo.

Soluzione:  Sono disponibili due opzioni:

  • Modificare i diritti delle macchine virtuali attive in modo che le CPU non siano assegnate in numero eccessivo

  • Arrestare una o più macchine virtuali fino a che quelle ancora attive non non abbiano un numero eccessivo di CPU.

L'interruzione dell'amministrazione di una macchina virtuale avviata lascia il dominio di risorse condivise non in attività

Quando si tenta di interrompere l'amministrazione di una macchina virtuale già avviata, l'attività del dominio di risorse condivise potrebbe essere arrestata, anche se è visualizzato il seguente messaggio:

The virtual machine nome_macchina_virtuale on host nome_host is on but does not have an associated gWLM policy. Please turn the virtual machine off, or apply a gWLM policy to provide the necessary resources.

Soluzione:  Arrestare la macchina virtuale e rimettere in attività il dominio di risorse condivise che la contiene.

Lo strumento per le comunicazioni protette di gWLM non funziona nei sistemi Red Hat Linux

Lo strumento Configure->Configure VSE Agents->Secure gWLM Communications potrebbe non avere successo nel tentativo di copiare lo script di amministrazione nei nodi amministrati Red Hat se non è presente la directory /var/adm. Alcune installazioni di Red Hat Linux non contengono questa directory.

Se in un sistema non è presente la directory /var/adm e si tenta di utilizzare questo strumento, nella finestra di output dei comandi potrebbe essere visualizzato un messaggio di errore simile al seguente:

cp: cannot create /var/adm/gwlmagentconfig: No such file or directory

Soluzione:  Eseguire l'accesso al sistema in cui si è verificato l'errore, usando l'account root, quindi creare manualmente la directory usando il comando seguente:

# mkdir /var/adm

Estensioni dei file di log diverse da .log.0, .log.1 e .log.2

Global Workload Manager è ideato per utilizzare le estensioni .log.0, .log.1 e .log.2 per i suoi file di log. Un blocco Java dei file garantisce che solamente un unico processo gWLM sia in grado di aggiornare un file di log in qualsiasi momento. A partire da Java 1.4.2.06, il blocco dei file consente la creazione di file con estensione nella forma .log.0.n, dove n è un numero intero.

Soluzione:  Se si utilizza Java versione 1.4.2.06 o successiva e si desidera controllare nei file di log la presenza di errori, per cercare quali file contengono messaggi di errore recenti, utilizzare il seguente comando:

# /bin/ls -ltr /var/opt/gwlm/*log*

Quindi, sarà possibile utilizzare /usr/bin/tail per visualizzare i messaggi nei file di log aggiornati di recente.

Se i file di log devono essere inviati all’assistenza HP, creare un file tar usando i comandi seguenti:

# cd /
# tar cvf /tmp/gwlmlogs4support.tar var/opt/gwlm/*log*

Inviare quindi all'assistenza HP il file /tmp/gwlmlogs4support.tar.

Versione stampabile
Informativa sulla privacy Usando questo sito si accettano le sue condizioni
© 2006-2007 Hewlett-Packard Development Company, L.P.