 |
» |
|
|
 |
|  |  |
Esta sección analiza problemas y sus soluciones en
relación con HP gWLM versión A.02.00.00.x. La
mejora de dominios de recursos compartidos basados en particiones
precisa redetección |  |
| Problema | | Si tiene cualquiera de los dos tipos siguientes
de dominios de recursos compartidos basados en particiones: Un dominio de recursos compartidos
basado en particiones virtuales dentro de una nPartición Un dominio de recursos compartidos basado en nParticiones
que utilice Instant Capacity
y mejora los agentes gWLM de las particiones de gWLM A.01.x
a gWLM A.02.00.00.x, no podrá agregar otras particiones
del mismo complejo en el dominio de recursos compartidos. | | Solución | | Utilice la interface de línea de comandos
de gWLM para restablecer el dominio de recursos compartidos: Con el dominio de recursos compartidos
desplegado, vuelva a detectarlo: Para el dominio de recursos compartidos basado en particiones virtuales: # gwlm discover --type=vpar --file=/tmp/myfile.xml hosts Para el dominio de recursos compartidos basado en nParticiones: # gwlm discover --type=npar --file=/tmp/myfile.xml hosts donde hosts es una lista separada por espacios de las particiones
del dominio de recursos compartidos. Compruebe que el atributo de modo del elemento sharedResourceDomain
del archivo myfile.xml está definido en Managed (administrado)
[no Advisory (consultivo)] si procede: mode="Managed" Compruebe que el atributo de intervalo del elemento sharedResourceDomain
está definido en el valor deseado, por ejemplo, x: interval="x" Importe el archivo para volver a crear el dominio
de recursos compartidos: # gwlm import --file=/tmp/myfile.xml --clobber Puesto que el dominio de recursos compartidos ya está desplegado,
la definición del nuevo dominio de recursos compartidos
se despliega al importar, ocupando el lugar del dominio de recursos
compartidos original.
|
Los
nodos administrados desaparecen de la supervisión del dominio de
recursos compartidos |  |
| Problema | | Si un nodo administrado pierde el contacto con el
sistema CMS, desaparece de la vista Shared Resource Domain View
y de la salida de gwlm monitor (sin ninguna indicación de que exista
un problema). | | Solución | | Compruebe que gwlmagent aún se ejecuta y que no hay ningún
problema con la red. |
Integrity
VM impide la detección de conjuntos de procesadores y grupos
fss |  |
| Problema | | Cuando se instala el agente gWLM en un sistema que
tenga instalado HP Integrity Virtual Machines (Integrity VM), las
operaciones de detección sólo notifican los compartimentos
de Integrity VM, aun cuando haya conjuntos de procesadores y grupos
fss. | | Solución | | Para detectar conjuntos de procesadores o grupos
fss en el sistema, deberá desinstalar Integrity VM. |
La
detección no muestra información actual para los
equipos virtuales detenidos |  |
| Problema | | La detección realizada por gWLM no siempre
notifica información actual para los equipos virtuales
detenidos. Específicamente, cuando un equipo virtual se
detiene y el número de CPU virtuales se modifica, la detección realizada
por gWLM no muestra el número modificado de CPU virtuales.
En su lugar, muestra el número de CPU virtuales correspondiente
al inicio más reciente del equipo virtual. | | Solución | | Inicie los equipos virtuales antes de efectuar la
detección. |
Varias
tarjetas de interface de red |  |
| Problema | | gWLM, como aplicación de cliente-servidor
que es, es más sensible a la configuración de
red del sistema host que otros tipos de aplicaciones. gWLM admite
la administración sólo en el marco de un dominio
de red individual. Si, por ejemplo, el sistema host CMS tiene varias
tarjetas de interface de red que están conectadas a varias
redes distintas, gWLM necesita que el nombre de host completo resuelva
la dirección IP que será accesible por los agentes gWLM
que hayan de administrarse. Este problema constituye una preocupación sobre todo
cuando un sistema host está conectado a los dos elementos
siguientes: Una red LAN/WAN empresarial a través
de una tarjeta de interface de red y una dirección IP Una segunda red interna privada y dirección
IP privada para comunicar con otro conjunto determinado de sistemas
host (por ejemplo, los miembros de un clúster)
gWLM intenta detectar y notificar problemas de configuración
con la red que puedan acarrear un comportamiento no deseable, pero
en algunos casos dicha detección se produce en un contexto
del que sólo puede informarse en un archivo de registro. | | Solución | | Si surge algún comportamiento
imprevisto (por ejemplo, un agente gWLM que no consigue actualizar
ni informar del estado de sus cargas de trabajo), examine el archivo
/var/opt/gwlm/glwmagent.log.0 del sistema host en busca de errores. |
Alias
de nombre de host |  |
| Problema | | gWLM no admite alias de nombres de host. Sólo
admite el nombre DNS canónico (el nombre de dominio completo)
de un sistema host. | | Solución | | Utilice sólo nombres
DNS canónicos al configurar gWLM a través de HP Systems
Insight Manager o de un archivo XML utilizado con el comando
gwlm. |
No
se puede crear un dominio de recursos compartidos individual (Unable
to build a single shared resource domain) |  |
| Problema | | Se obtiene el siguiente mensaje
en la interface SIM con gWLM: Unable to build a single shared resource domain from the set of specified hosts: mihostA.midominio.com mihostB.midominio.com | | Solución | | Este mensaje normalmente se debe a que los sistemas
host están en complejos diferentes. No obstante, si los
sistemas host se ubican en el mismo complejo, compruebe las versiones
de los agentes gWLM en dichos sistemas host. gWLM necesita que todos los agentes de un dominio de recursos compartidos
individual sean de la misma versión. Instale la misma versión del
agente en todos los nodos administrados del dominio de recursos compartidos. |
Error
durante la detección de compartimentos (Error during discovery
of compartments) |  |
| Problema | | El siguiente mensaje se obtiene cuando se utiliza
el asistente Manage New Systems o el comando gwlm discover: Error during discovery of compartments. y el archivo /var/opt/gwlm/gwlmagent.log.0 contiene el mensaje: com.hp.gwlm.common.PlatformException: /usr/sbin/parstatus -w exited with a non-zero exit status. Captured stderr is: Error: Unable to get the local partition number. | | Solución | | La causa más probable es que haya una versión
anticuada del software de nParticiones. Instale el software de nParticiones
más reciente, aun cuando no utilice nParticiones. Para HP-UX 11i v1, compruebe que tiene B.11.11.01.03.01.01
o posterior. Para HP-UX 11i v2 en HP 9000, compruebe que tiene B.11.23.01.03.01.01
o posterior. Para HP-UX 11i v2 en HP Integrity, compruebe que tiene B.11.23.01.04
o posterior. Este producto se facilita en: El CD de revisiones de aplicaciones
(AR) trimestral a partir de mayo de 2005 http://software.hp.com, buscando “nPartition
Provider”
(gWLM utiliza un comando aportado por este software, que normalmente está en
todas las versiones de HP-UX, para determinar las capacidades del sistema.) |
Configuración
fuera de sincronización |  |
| Problema | | De vez en cuando, un agente gWLM y el sistema gWLM
CMS pueden discrepar sobre si un dominio de recursos compartidos
está realmente desplegado o no. Esto puede suceder cuando
se utiliza ^C (Control-C) para interrumpir un comando gwlm deploy o undeploy. También puede suceder si se producen
errores al guardar una configuración gWLM: La configuración
se despliega y, a continuación, se guarda en el depósito
de configuración de gWLM. Si el despliegue se produce pero
el almacenamiento no se lleva a cabo, el agente gWLM percibe el
dominio de recursos compartidos como desplegado mientras que el
sistema CMS considera que está plegado. | | Solución | | Utilice la opción --force con gwlm deploy o gwlm undeploy para resincronizar el agente y el sistema CMS. Por ejemplo, ejecute el siguiente comando para resincronizar,
forzando que el agente y el sistema CMS consideren el dominio de
recursos compartidos como desplegado: # /opt/gwlm/bin/gwlm deploy --srd=dominio_de_recursos_compartidos --force sustituyendo dominio_de_recursos_compartidos por el nombre del dominio de recursos compartidos. Para obtener más información sobre el comando gwlm, consulte la página de manual de gwlm(1M). |
El
bloqueo ya lo mantiene (The lock is already held by) |  |
Datos
históricos que faltan o imprevistos |  |
| Problema | | No se dispone de datos históricos a efectos
de representación gráfica (aunque se tenga la
certeza de que se ha desplegado un determinado dominio de recursos
compartidos durante el intervalo de tiempo en cuestión). Se produce un problema afín al seleccionar un intervalo
de tiempo en que se espera una actividad elevada del sistema, pero
el gráfico muestra una actividad limitada. Asimismo, se
puede esperar una actividad muy escasa durante un intervalo de tiempo,
pero el gráfico muestra mucha actividad. | | Solución | | Compruebe que los relojes de sistema del sistema
CMS y de todos los sistemas del dominio de recursos compartidos
están sincronizados. Si los relojes difieren de forma significativa,
es posible que gWLM no pueda hacer coincidir los datos procedentes
de los nodos administrados con el intervalo que se trate de representar
gráficamente. |
gwlmreport: Falta una muestra al principio y/o al final del
informe |  |
| Problema | | Un informe de gwlmreport se basa en un intervalo de informe que empieza a
medianoche del día en que comienza el informe y termina
a medianoche del día en que concluye el informe. Las muestras
que solapan la medianoche al principio o al final del intervalo
de informe se excluyen del informe. | | Solución | | No hay ninguna solución,
pero debe tener en cuenta este comportamiento. Es posible que estas muestras se incluyan en el informe
en una revisión futura. |
La
definición de los pesos de directiva en 0 produce una asignación asimétrica |  |
| Problema | | Los pesos de directiva ayudan a gWLM a determinar
las asignaciones de recursos cuando hay un excedente de recursos.
Con los pesos de todas las directivas utilizadas en un dominio de
recursos compartidos definidos en el mismo valor, los recursos deberían
asignarse equitativamente a las cargas de trabajo asociadas. No
obstante, definir los pesos en 0 para todas las directivas de un
dominio de recursos compartidos hace que se asigne a una sola carga
de trabajo todo el excedente de recursos. | | Solución | | En lugar de utilizar un 0,
utilice un 1 para los valores de peso. |
No
se puede eliminar la carga de trabajo (OTHER) por defecto |  |
| Problema | | Al intentar eliminar la carga de trabajo (OTHER)
por defecto en un dominio de recursos compartidos se genera el mensaje: Removal of all compartments from an SRD is not allowed | | Solución | | No se puede eliminar le carga
de trabajo (OTHER) por defecto de un dominio de recursos compartidos.
En su lugar, deberá desplegar el dominio de recursos compartidos. |
Extensiones
de archivos de registro diferentes de .log.0, .log.1 y .log.2 |  |
| Problema | | gWLM se ha diseñado para utilizar las extensiones
de archivo .log.0, .log.1 y .log.2 para los archivos de registro.
gWLM utiliza Java para bloquear archivos a fin de asegurar que sólo
haya un proceso gWLM actualizando un archivo de registro en cualquier
momento dado. A partir de Java 1.4.2.06, el bloqueo de archivos
permite crear archivos con extensiones que presentan la forma .log.0.n, donde n es algún entero. | | Solución | | Si utiliza Java versión 1.4.2.06 o posterior
y desea consultar los archivos de registro en busca de mensajes
de error, utilice el siguiente comando para ver qué archivos
contienen mensajes de error recientes: # /bin/ls -ltr /var/opt/gwlm/*log* A continuación, puede utilizar /usr/bin/tail para ver mensajes en los archivos de registro
actualizados recientemente. Si envía los archivos de registro al servicio de
soporte técnico de HP, cree un archivo con formato tar: # cd / # tar cvf /tmp/gwlmlogs4support.tar var/opt/gwlm/*log* A continuación, envíe el archivo /tmp/gwlmlogs4support.tar
al servicio de soporte técnico. |
Índice
de convergencia y directivas OwnBorrow/Utilization |  |
| Problema | | El valor de índice de convergencia que
se especifica opcionalmente al definir una directiva actualmente
sólo afecta a las directivas personalizadas. Las directivas
OwnBorrow y Utilization no se ven afectadas. | | Solución | | Este problema se abordará en una revisión
futura de gWLM. |
No
se puede crear un subproceso nativo nuevo (...unable to create new
native thread) |  |
| Problema | | Se obtiene un mensaje que incluye el texto: ...unable to create new native thread | | Solución | | Esto se debe a que hay determinados parámetros
del kernel definidos con un valor demasiado bajo. max_thread_proc Para conjuntos de procesadores y grupos
fss: En HP-UX 11 v1, defina max_thread_proc en al menos 192. En HP-UX v2, septiembre de 2004 y posterior, defina max_thread_proc en al menos 768.
Para particiones virtuales: Defina max_thread_proc en al menos 768.
nkthread Defina nkthread para permitir el valor max_thread_proc así como el número de subprocesos
que necesiten los demás procesos en el sistema.
|
Mensaje
de advertencia erróneo sobre un valor máximo de
directiva que sobrepasa un valor máximo de compartimento |  |
| Problema | | Con las directivas de utilización,
se pueden obtener mensajes de advertencia con la forma: Policy maximum (x CPUs) is greater than compartment maximum (y CPUs). Using compartment maximum instead. donde x es, en realidad, menor que y. | | Solución | | Puede hacer caso omiso de
este mensaje de advertencia. gWLM utilizará realmente el
valor máximo de directiva. Si prefiere deshacerse de los mensajes de advertencia,
para cada directiva de utilización: Exporte la directiva Suponiendo que el nombre de la directiva sea miDirUtil, ejecute el comando: # /opt/gwlm/bin/gwlm export --policy=miDirUtil \ --file=/tmp/myTmpPol Importe la directiva # /opt/gwlm/bin/gwlm import --file=/tmp/myTmpPol --clobber
|
Pérdida
de las mediciones personalizadas en el redespliegue |  |
| Problema | | Las directivas personalizadas utilizan valores de
medición que el usuario proporciona a través del
comando gwlmsend. Si se redespliega un dominio de recursos compartidos
que tenga una directiva personalizada, se pierde el valor más
reciente de la medición de la directiva. En esta situación,
gWLM fundamenta las asignaciones en la solicitud mínima
especificada en la directiva de la carga de trabajo. La carga de
trabajo también puede obtener los recursos de CPU que queden
después de satisfacer todas las directivas. | | Solución | | Asegúrese de que actualiza los valores
de mediciones de todas las directivas personalizadas inmediatamente
después de un redespliegue. |
Puede
haber varios dominios de recursos compartidos basados en particiones
virtuales |  |
| Problema | | Normalmente, gWLM no permite
crear al mismo tiempo varios dominios de recursos compartidos basados
en particiones virtuales en una sola nPartición o sistema.
No obstante, cuando hay varios usuarios de gWLM desplegando dominios
de recursos compartidos casi al mismo tiempo, gWLM puede permitir
por error que existan los diversos dominios de recursos compartidos
mencionados. | | Solución | | Elimine uno de los dominios de recursos compartidos
y, a continuación, vuelva a administrar las cargas de trabajo
procedentes del dominio de recursos compartidos eliminado colocándolas
en los dominios de recursos compartidos restantes. |
No
se puede desplegar un dominio de recursos compartidos (Unable to
deploy shared resource domain) |  |
| Problema | | Se puede ver un mensaje parecido al siguiente mensaje
de error: Unable to deploy Shared Resource Domain: system1.pset.000, due to: Error starting Compartment Manager. Please save file /var/opt/gwlm/gwlmagent.log.0 and contact HP technical support. Este error se puede producir si se tiene un conjunto de procesadores
vacío (un conjunto de procesadores sin ninguna CPU asignada
al mismo) en un sistema al crear y, a continuación, intentar
desplegar un dominio de recursos compartidos que incluya dicho sistema. | | Solución | | Asigne CPU al conjunto de procesadores o quite el
conjunto de procesadores y, a continuación, intente crear
el dominio de recursos compartidos y desplegarlo. |
Carga
en curso de datos en tiempo real (Real-time data is currently loading) |  |
| Problema | | Se puede obtener el siguiente mensaje al intentar
ver informes en tiempo real: Real-time data is currently loading, please wait... You might also verify that the remote node is running and SRDs have been deployed. |
| | Solución | | Normalmente, esta condición es meramente
temporal. Si continúa, compruebe que el demonio gwlmagent se ejecuta en los nodos remotos. Si se ejecuta,
deténgalo y reinícielo. Si la condición
aún continúa, pliegue y vuelva a desplegar el
dominio de recursos compartidos. |
Sólo
se permite desplegar un dominio de recursos compartidos |  |
| Problema | | Se muestra un mensaje parecido al siguiente: Error trying to deploy SRD, mysystem.vpar.000 to mysystem2.mydomain.com. SRD, mysystem2.fss.000 is already deployed. Only one SRD is allowed to be deployed. |
| | Solución | | Pliegue el dominio de recursos compartidos utilizando
la opción --force con gwlm undeploy y reinicie gwlmagent en el nodo administrado. |
La
supervisión de un dominio de recursos compartidos puede bloquearse |  |
| Problema | | gWLM no muestra las actualizaciones de supervisión
para un dominio de recursos compartidos: ni en la línea
de comando ni a través de la interface gráfica
del administrador HP SIM. | | Solución | | Esto puede deberse a que un nodo administrado está inactivo
o a que su gwlmagent no se ejecuta. Si el nodo está activo,
pero el agente no se ejecuta, es posible que se disponga de una
supervisión limitada. Para abordar este problema, reinicie gwlmagent en el nodo administrado. |
Una
aplicación se bloquea en un grupo FSS |  |
| Problema | | En HP-UX 11i v2 (B.11.23),
una aplicación ubicada en un grupo fss puede bloquearse
al ejecutarse en una partición virtual, nPartición
o sistema de un solo procesador. | | Solución | | Instale el parche PHKL_33052. |
Las
secuencias de comandos no se colocan en las cargas de trabajo correctas |  |
Los
procesos se trasladan al conjunto de procesadores por defecto o al
grupo fss por defecto |  |
| Problema | | Si los procesos se han colocado en cargas de trabajo
con ayuda del comando gwlmplace, y se produce alguno de los siguientes sucesos,
los procesos se trasladan normalmente al conjunto de procesadores
por defecto o al grupo fss por defecto. El nodo administrado
se reinicia El demonio gwlmagent local se reinicia Se despliega el dominio de
recursos compartidos actual Se despliega un dominio de
recursos compartidos
En estos casos, los procesos se colocan según los
registros de aplicaciones o los registros de usuarios que correspondan.
Si no existe ningún registro, los procesos están
sujetos a las reglas de colocación, que se explican en
el tema de la ayuda en línea “pset / fss group
tips”, en la sección titulada “Precedence
of placement techniques”. | | Solución | | Para mantener las colocaciones de los procesos entre
redespliegues, utilice los registros de aplicaciones o los registros
de usuarios de gWLM al crear o modificar las definiciones de cargas
de trabajo en gWLM. |
Se
hace caso omiso de la colocación de procesos utilizando psrset |  |
| Problema | | Cuando gWLM administra los conjuntos de procesadores
en un sistema, todos los procesos del sistema tienen que ubicarse
en una carga de trabajo. gWLM coloca los procesos según
los registros de aplicaciones o los registros de usuarios especificados
al crear o modificar la definición de una carga de trabajo.
Si no existe ningún registro, los procesos están
sujetos a las reglas de colocación, que se explican en
el tema de la ayuda en línea “pset / fss group
tips”, en la sección titulada “Precedence
of placement techniques”. Si utiliza psrset para colocar los procesos en conjuntos de procesadores,
es muy probable que gWLM traslade los procesos al conjunto de procesadores por
defecto. | | Solución | | Para mantener la colocación de un proceso,
utilice los registros de aplicaciones o los registros de usuarios
de gWLM al crear o modificar las definiciones de cargas de trabajo
en gWLM. Si el uso de registros no resulta práctico, utilice
el comando gwlmplace. No obstante, tendrá que utilizar gwlmplace después de cada redespliegue de un dominio
de recursos compartidos para volver a ubicar los procesos en las
cargas de trabajo deseadas. |
No
se pueden quitar los grupos fss abandonados |  |
| Problema | | Se han abandonado grupos fss creados por gWLM y
no se pueden quitar con facilidad. Esta situación se puede
producir debido a diversas circunstancias. Una de ellas consiste
en que al administrar un dominio de recursos compartidos basado
en grupos fss, se utilice un segundo sistema CMS (quizá porque
el sistema CMS original se haya desactivado). Esto puede dejar al dominio
de recursos compartidos con grupos fss que no se pueden quitar. | | Solución | | Quite los grupos fss. Se dispone de varias opciones para quitar los grupos. Si tiene
instalado el administrador PRM, ejecute el comando: # /opt/prm/bin/prmconfig -r Si no tiene instalado el administrador PRM, ejecute los siguientes
comandos de gWLM: Ejecute la detección: # /opt/gwlm/bin/gwlm discover host --file=myfile.xml \ --type=fss donde host es el sistema con los grupos fss Importe myfile.xml al depósito de configuración: # /opt/gwlm/bin/gwlm import --file=myfile.xml Determine el nombre del dominio de recursos compartidos
ejecutando el siguiente comando y comprobando la salida de los nombres
que incluyan host: # /opt/gwlm/bin/gwlm list Supongamos que el nombre es host.fss.xyz (donde xyz son números: 0-9). Despliegue el dominio de recursos compartidos: # /opt/gwlm/bin/gwlm deploy --srd=host.fss.xyz donde se sustituye “host.fss.xyz” por el nombre del dominio de recursos compartidos
real Pliegue el dominio de recursos compartidos: # /opt/gwlm/bin/gwlm undeploy --srd=host.fss.xyz donde se sustituye “host.fss.xyz” por el nombre del dominio de recursos compartidos
real
Los grupos fss ya deberían haber desaparecido del
sistema. No obstante, las definiciones de las cargas de trabajo
correspondientes aún estarán en el depósito
de configuración de gWLM. Estas definiciones, y la definición
del dominio de recursos compartidos, se pueden quitar del depósito
de una de dos formas. La primera opción consiste en quitar dichas definiciones
utilizando la interface de gWLM en HP Systems Insight
Manager. Seleccione el menú: Optimize -> Global Workload Manager (gWLM) -> Shared Resource Domains... a continuación, seleccione el dominio de recursos
compartidos con los grupos fss y el menú (ubicado en la
barra de menús de VSE Management): Delete -> Shared Resource Domain La segunda opción consiste en utilizar la línea
de comandos: Determine el nombre del dominio de
recursos compartidos y los nombres de las cargas de trabajo ejecutando
el siguiente comando: # /opt/gwlm/bin/gwlm list Supongamos que el nombre es host.fss.xyz (donde xyz son números: 0-9). Elimine la definición del dominio de recursos
compartidos sustituyendo “host.fss.xyz” por el nombre del dominio de recursos compartidos
real: # /opt/gwlm/bin/gwlm delete --srd=host.fss.xyz Elimine las definiciones de cargas de trabajo repitiendo
el siguiente comando, donde “host.fssN.xyz” debe
sustituirse por el nombre de cada carga de trabajo: # /opt/gwlm/bin/gwlm delete --workload=host.fssN.xyz donde N es un número entre 1 y el número
total de grupos fss del sistema.
|
|