Ir al contenido España-Español
HP.com España principal Productos y Servicios Soporte y Drivers Soluciones Cómo Comprar
» Contactar con HP
Más opciones
HP.com España principal
Notas de la revisión del software de administración VSE versión A.03.00.00 > Capítulo 5 Notas de la revisión específicas de aplicaciones

Notas de la revisión de Global Workload Manager

» 

Documentación técnica

Libro completo en PDF
» Documentos relacionados
» Comentarios
Aquí empieza el contenido

 » Tabla de contenido

 » Índice

Compatibilidad con el control externo de las CPU y del sistema

Se espera que Global Workload Manager tenga un control completo de las CPU disponibles en un sistema mientras un dominio de recursos compartidos está desplegado. No obstante, hay ocasiones en las que deben efectuarse ajustes manuales, por ejemplo:

  • Ajustes del número de núcleos en un sistema donde gWLM tenga un dominio de recursos compartidos

  • Ajustes de los recursos TiCAP, los recursos iCAP, las particiones virtuales (incluidos los cambios en la vinculación de núcleos) o las nParticiones

  • Cambios del número de CPU virtuales de un equipo virtual mientras gWLM administra el equipo virtual

  • Creación o eliminación de un conjunto de procesadores utilizando el comando psrset en un sistema donde gWLM administra compartimentos de conjuntos de procesadores

  • Traslado de memoria de una partición virtual a otra con ayuda del comando vparmodify

  • Realización de operaciones en línea con células mediante el comando parolrad

  • Habilitación o deshabilitación del hipersubprocesamiento

Solución

Si tiene que efectuar alguno de estos ajustes manuales, dé estos pasos:

  1. Pliegue el dominio de recursos compartidos que contenga los sistemas que desee ajustar.

  2. Efectúe los ajustes.

  3. Vuelva a crear y a desplegar el dominio de recursos compartidos.

Compatibilidad con HP Integrity Virtual Machines

Global Workload Manager A.03.00.00 no es compatible con las versiones de HP Integrity VM anteriores a la versión A.02.00. Si desea administrar equipos virtuales mediante gWLM A.03.00.00, HP recomienda mejorar a HP Integrity VM versión A.03.00 o posterior.

Si no realiza la mejora, puede obtener mensajes como:

Unable to deploy SRD nombre: A VM encountered with no size

o

Unable to deploy SRD 'nombre':guestCpuSetEntitlement (): hpvm_nonvm_cpu_set_entitlement (HPVM_NONVM, (100.000000,100.000000),FALSE) failed: (0,90)

Solución

Mejore a HP Integrity VM versión A.03.00 o posterior, si es posible.

Si no puede mejorar a partir de HP Integrity Virtual Machines versión A.01.20, deberá instalar el agente gWLM versión A.02.00.00 en el sistema VM Host.

Si no puede mejorar a partir de HP Integrity Virtual Machines versión A.02.00, instale el agente gWLM versión A.02.50.00 o utilice gWLM A.03.00.00 para administrar sólo equipos virtuales con concesiones especificadas en porcentajes. (Es decir, no administre equipos virtuales con concensiones especificadas en ciclos de CPU.)

Para obtener versiones anteriores del agente gWLM, y ayuda con esta configuración, póngase en contacto con HP en la siguiente dirección electrónica: .

Compatibilidad con PRM y WLM

gWLM no se puede utilizar con Resource Manager (PRM) ni Workload Manager (WLM) para administrar el mismo sistema al mismo tiempo. Si se intenta hacerlo, se obtendrá un mensaje que indica que la aplicación que en realidad administra el sistema mantiene un bloqueo. Para utilizar gWLM en esta situación, antes apague la aplicación que mantiene el bloqueo.

Para el administrador PRM, escriba los siguientes comandos:

# /opt/prm/bin/prmconfig -d
# /opt/prm/bin/prmconfig -r

Para el administrador WLM, escriba el siguiente comando:

# /opt/wlm/bin/wlmd -k

Compatibilidad con Global Instant Capacity

Para obtener información sobre las restricciones existentes cuando se utiliza gWLM con Global Instant Capacity, visite la dirección http://docs.hp.com/en/vse.html y localice el libro blanco «Using Global Workload Manager 3.0 with Global Instant Capacity».

Incompatiblidad poco común con las particiones virtuales

Según las características de las cargas de trabajo, gWLM puede migrar recursos de CPU con rapidez. Esta migración frecuente puede generar en potencia, aunque de modo muy poco común, una condición de carrera (race condition), haciendo que la partición virtual se bloquee. También puede generar una emergencia, dando lugar a uno o varios de los siguientes mensajes:

No Chosen CPU on the cell-cannot proceed with NB PDC.

o

PDC_PAT_EVENT_SET_MODE(2) call returned error

Solución

Mejorar a vPars A.03.04 soluciona este problema.

Con las versiones anteriores de vPars, este problema se puede solucionar del modo siguiente: Asigne (mediante la asignación de rutas) al menos una CPU por célula como una CPU vinculada a al menos una partición virtual. (Puede ser cualquier partición virtual.) Esto garantiza que no se produzca una nueva designación en las migraciones de CPU. Por ejemplo, si tiene cuatro células (0, 1, 2, 3), cada una de ellas con cuatro CPU (10, 11, 12, 13) y cuatro particiones virtuales (vpar1, vpar2, vpar3, vpar4), puede asignar 0/1x a vpar1, 1/1x a vpar2, 2/1x a vpar3 y 3/1x a vpar4, donde x is 0,1,2,3.

Migración de los equipos virtuales

Si migra un equipo virtual desde un sistema VM Host que forma parte de un dominio de recursos compartidos, deberá eliminar el equipo virtual del dominio de recursos compartidos antes de agregarlo en un dominio de recursos compartidos del nuevo sistema VM Host.

Elimine el equipo virtual en el dominio de recursos compartidos antes de migrarlo. Migrar el equipo virtual antes de eliminarlo del dominio de recursos compartidos puede dar lugar a las siguientes condiciones, según la interface utilizada.

Solución

  • Mediante la interface de HP SIM:

    Según lo previsto, los mensajes de error indicarán que el equipo virtual falta. Para eliminar el equipo virtual del dominio de recursos compartidos, selecciónelo y, a continuación, en la barra de menús de VSE Management, seleccione Policy->Remove Associated gWLM Policy.

  • Mediante la interface de línea de comandos:

    1. Fuerce el pliegue del dominio de recursos compartidos que contiene el equipo virtual.

    2. Elimine el equipo virtual del dominio de recursos compartidos.

    3. Vuelva a desplegar el dominio de recursos compartidos.

Soluciones a anomalías de gWLM 3.0

Global Workload Manager versión A.03.00.00 incluye las siguientes soluciones a anomalías:

Sobrescritura del archivo gwlmcms.properties

Comportamiento anterior: El archivo /etc/opt/gwlm/conf/gwlmcms.properties se sobrescribe cuando se ejecuta vseinitconfig.

Comportamiento actual: El archivo /etc/opt/gwlm/conf/gwlmcms.properties ya no se sobrescribe.

La administración de nParticiones con iCAP B.08.00 necesita un saldo de TiCAP positivo

Comportamiento anterior: Global Workload Manager utiliza iCAP para administrar nParticiones. Con iCAP B.08.00, los intentos de gWLM por modificar recursos iCAP son infructuosos a menos que el sistema tenga un saldo positivo de TiCAP.

Comportamiento actual:  No se necesita un saldo positivo de TiCAP.

Administración de particiones virtuales anidadas en una nPartición

Comportamiento anterior:  En un dominio de recursos compartidos que administre particiones virtuales anidadas en una nPartición, es posible que vea información de estado que indica un mensaje de advertencia Major en la vista de dominios de recursos compartidos. Este mensaje de advertencia indica que la asignación de CPU es mayor que el tamaño del dominio de recursos compartidos.

Comportamiento actual: Actualmente, se puede administrar un subconjunto de las particiones virtuales de una nPartición sin generar mensajes de advertencia.

Pérdida de la configuración de directivas personalizadas al modificarlas

Al modificar una directiva personalizada, la selección del botón OK define el valor Metric Response en Inverse.

Solución

Puede modificar la directiva mediante la interface de línea de comandos de gWLM según se describe a continuación.

  1. Exporte la directiva mediante el siguiente comando:

                #  gwlm export --policy=mi_directiva_personalizada --file=mi_directiva_personalizada.xml
  2. Modifique la directiva.

    Abra el archivo en un editor de texto y efectúe los cambios deseados. (Para obtener descripciones del archivo XML, consulte la página de manual de gwlmxml(4).)

  3. Importe la directiva.

                #  gwlm import --file=mi_directiva_personalizada.xml

La mejora de dominios de recursos compartidos basados en particiones precisa redetección

Si utiliza gWLM y tiene cualquiera de los dos siguientes tipos de dominios de recursos compartidos basados en particiones, y ha mejorado los agentes gWLM de las particiones desde gWLM A.01.x a gWLM A.03.00.00, no puede agregar otras particiones en el mismo complejo del dominio de recursos compartidos:

  • Un dominio de recursos compartidos basado en particiones virtuales dentro de una nPartición

  • Un dominio de recursos compartidos basado en nParticiones que utiliza iCAP

Solución

Utilice el siguiente procedimiento en el servidor CMS para restablecer el dominio de recursos compartidos:

  1. Con el dominio de recursos compartidos desplegado, vuelva a detectarlo. Para un dominio de recursos compartidos basado en particiones virtuales, escriba el siguiente comando:

    # /opt/gwlm/bin/gwlm discover --type=vpar \
      --file=/tmp/myfile.xml hosts

    Para un dominio de recursos compartidos basado en nParticiones, escriba el siguiente comando:

    # gwlm discover --type=npar \
      --file=/tmp/myfile.xml hosts

    En estos comandos, sustituya hosts por una lista separada por espacios de las particiones del dominio de recursos compartidos.

  2. Realice los siguientes ajustes en el archivo /tmp/myfile.xml, según se explica en la página de manual de gwlmxml(4):

    • Compruebe que el atributo mode para el elemento sharedResourceDomain se ha definido en el valor deseado (Managed o Advisory):

      mode="Managed"

    • Compruebe que el atributo interval para el elemento sharedResourceDomain se ha definido en el valor deseado:

      interval="x"

    • Compruebe que el atributo ticapMode para el elemento sharedResourceDomain se ha definido en all si desea que gWLM asigne TiCAP cuando proceda:

      ticapMode="all"

    • Compruebe que las entradas workloadReference en las definiciones de compartimento son correctas y ajuste los nombres en las propias definiciones de carga de trabajo. Por ejemplo, podría tener host.OTHER.2 en lugar de host.OTHER.

  3. Importe el archivo para volver a crear el dominio de recursos compartidos:

    # gwlm import --file=/tmp/myfile.xml --clobber

    Puesto que el dominio de recursos compartidos ya se había desplegado, la definición del nuevo dominio de recursos compartidos se despliega al importar, ocupando el lugar del dominio de recursos compartidos original.

Uso constante de TiCAP

Global Workload Manager puede activar TiCAP si es necesario para cumplir con las directivas de dominios de recursos compartidos. Para evitar el consumo innecesario de TiCAP, deberá tener una cantidad suficiente de CPU con licencias permanentes disponibles. Si el dominio de recursos compartidos rebasa dicha cantidad, se consume TiCAP para satisfacer las necesidades del dominio de recursos compartidos.

Solución

Desactive los recursos de TiCAP antes de crear un dominio de recursos compartidos. Todo recurso de TiCAP que esté activo en este momento se incluirá en el dominio de recursos compartidos y, por lo tanto, se consumirá siempre que se despliegue el dominio de recursos compartidos.

Las cargas de trabajo de gWLM no siguen a los paquetes Serviceguard asociados

gWLM puede administrar una carga de trabajo sólo en un dominio de recursos compartidos desplegado a la vez. Por consiguiente, si una carga de trabajo se asocia directamente a un paquete Serviceguard (mediante el selector del cuadro de diálogo Workload Definition), gWLM puede administrarla sólo en uno de los sistemas host donde pueda ejecutarse en potencia.

Si un equipo virtual se asocia a un paquete Serviceguard, el equipo virtual se representa con una carga de trabajo distinta en cada sistema VM Host.

En cualquiera de los dos casos, actualmente no se puede administar una sola carga de trabajo mientras sigue a un paquete Serviceguard asociado.

Solución

Para una carga de trabajo asociada a un paquete Serviceguard, puede aplicar una directiva mediante compartimentos fss o de conjunto de procesadores en sólo uno de los dominios de recursos compartidos a los que la carga de trabajo podría conmutar por error. Para los demás dominios de recursos compartidos a los que la carga de trabajo podría conmutar por error, deberá aplicar una directiva en una instancia que incluya un sistema operativo (partición virtual o nPartición). Puede utilizar una directiva condicional gWLM para cambiar la asignación de recursos según qué paquetes haya presentes.

Para un equipo virtual asociado a un paquete Serviceguard, puesto que el equipo virtual se representa con una carga de trabajo distinta en cada sistema host, basta con administrar independientemente cada carga de trabajo en el dominio de recursos compartidos para cada sistema VM Host.

Procesadores locales en célula y el entorno iCAP

El uso de procesadores locales en célula con particiones virtuales en el marco de una nPartición que utilice iCAP da lugar a un error del comando icod_modify.

Solución

No asigne CPU utilizando especificaciones de célula. Considere la asignación de CPU a las particiones virtuales utilizando una ruta de hardware.

También, para utilizar procesadores locales en célula, actualice a vPars A.04.04 en HP-UX 11i v2 (B.11.23) o a vPars A.05.01 en HP-UX 11i v3 (B.11.31).

Se permite a varios dominios de recursos compartidos de un complejo utilizar TiCAP

Global Workload Manager permite que varios dominios de recursos compartidos de un complejo utilicen TiCAP: debe impedirse que se dé esta situación.

Solución

No configure dominios de recursos compartidos de este modo.

La realización de un cambio de configuración en un dominio de recursos compartidos grande es lenta

Los cambios efectuados en la configuración de un dominio de recursos compartidos grande que está desplegado pueden tardar mucho (varios minutos) en surtir efecto.

Solución

No hay ninguna solución. La cantidad de tiempo necesaria para completar un cambio depende del tiempo que se tarde en comunicar con todos los compartimentos del dominio de recursos compartidos.

Los sucesos relativos a la migración de CPU en gWLM pueden afectar al rendimiento del servidor CMS HP SIM

Los productos de HP System Fault Management (SFM) y Event Monitoring Service (EMS Hardware Monitors en concreto) generan sucesos, o indicaciones, cuando se migran las CPU. Según las características de las cargas de trabajo, gWLM puede migrar CPU con rapidez. Con el tiempo, esta migración frecuente puede conllevar una cantidad lo bastante grande de sucesos como para que el rendimiento del servidor CMS HP SIM se vea afectado negativamente.

Solución

Se dispone de las siguientes opciones como soluciones:

Opción 1 

Para los sistemas administrados por gWLM que ejecutan HP-UX 11i v3, instale los parches PHCO_36126 y PHSS_36078. (Estos parches se incluyen en la revisión de actualización para entornos operativos de septiembre de 2007.) Se facilita una solución para EMS Hardware Monitors con la revisión de actualización para entornos operativos de septiembre de 2007. Incluso con estos parches y soluciones, se sigue generando un suceso para cada cambio del recuento de CPU.

Para los sistemas administrados por gWLM que ejecutan HP-UX 11i v2, mejore a la revisión de actualización para entornos operativos de junio de 2007.

Opción 2 

Mejore a HP SIM C.05.01.00.01.xx en el servidor CMS. Esta versión de HP SIM no se suscribe por defecto a estos sucesos y no presentará un deterioro del rendimiento.

Opción 3 

Si desea suscribirse a los sucesos, defina la depuración de sucesos automática en HP SIM.

Para obtener información sobre cualquiera de estas soluciones, consulte la documentación de HP SIM (disponible en http://www.hp.com/go/hpsim).

El servidor CMS tarda en contestar

El servidor CMS tarda en contestar.

Solución

Mida el tiempo de un comando gwlm list en el servidor CMS. Si dura más de 10 segundos, dé los siguientes pasos:

  1. En el archivo /etc/opt/gwlm/conf/gwlmcms.properties, aumente el tamaño de la memoria caché de la base de datos del servidor CMS aumentando el valor de la propiedad com.hp.gwlm.cms.cachesize en un 25 %. (La memoria caché es más eficaz si el tamaño se acerca a una potencia de 2. Si el tamaño de caché de destino se acerca a una potencia de 2, redondéelo a la siguiente potencia. Por ejemplo, si el tamaño de caché de destino es 60.000, redondéelo a 66.000.)

  2. Detenga y reinicie gwlmcmsd con ayuda de los siguientes comandos.

    NOTA: Al detener gwlmcmsd, se deshabilitan Virtualization Manager y Capacity Advisor.
    # /opt/gwlm/bin/gwlmcmsd --stop   
    # /opt/gwlm/bin/gwlmcmsd
    

La instalación de un agente gWLM más nuevo en un servidor CMS más antiguo hace que el sistema sea inservible

Se puede instalar un agente gWLM más nuevo en un servidor CMS mediante una versión anterior de gWLM. Por ejemplo, puede instalar el agente A.03.00.00 en un sistema con CMS versión A.02.00.00.x. Esta configuración no es válida y hace que el sistema quede inservible.

Solución

Actualice la versión de CMS. Esta actualización también instala el agente correspondiente. (Puesto que gWLM necesita que todos los nodos administrados de un dominio de recursos compartidos tengan la misma versión de agente, deberá actualizar los agentes de cualquier otro nodo administrado que pueda estar en un dominio de recursos compartidos que incluya el servidor CSM. Para obtener información sobre la realización de esta actualización, consulte la Guía de instalación y actualización del software de administración VSE.

La eliminación de cargas de trabajo dura mucho tiempo

Después de emitir una solicitud para eliminar una carga de trabajo, completar la eliminación puede llevar mucho tiempo (varios minutos).

Solución

Elimine los datos históricos de supervisión y configuración de la base de datos de gWLM escribiendo el siguiente comando:

# gwlm history --truncate --truncate=<CCYY/MM/DD>

Si prefiere no ajustar la base de datos, puede eliminar simultáneamente varias cargas de trabajo con ayuda del comando gwlm delete.

Para obtener más información, consulte la página de manual de gwlm(1M).

Integrity VM impide la detección de conjuntos de procesadores y grupos fss

Cuando se instala el agente gWLM en un sistema que tiene instalado Integrity VM, las operaciones de detección sólo notifican los compartimentos de Integrity VM, aun cuando haya conjuntos de procesadores y grupos fss.

Solución

Para detectar conjuntos de procesadores o grupos fss en el sistema, deberá eliminar Integrity VM.

Sólo se pueden agregar cargas de trabajo con iguales administrados en los dominios de recursos compartidos con particiones anidadas

Con la interface de línea de comandos de gWLM no se puede agregar una carga de trabajo en un dominio de recursos compartidos que tenga particiones anidadas, a no ser que ya se administre un igual de dicha carga de trabajo en dicho dominio de recursos compartidos.

Solución

Esto no constituye un problema cuando se utiliza la interface de gWLM en el administrador HP SIM. Basta con seguir las instrucciones del paso 1 del asistente Manage Systems and Workloads (al que se obtiene acceso seleccionando Create->Shared Resource Domain) y con seleccionar el conjunto de sistemas host para incluir en un solo dominio de recursos compartidos.

No se puede eliminar la carga de trabajo de un dominio de recursos compartidos con particiones anidadas

Al intentar eliminar el último grupo fss (valor por defecto) de un dominio de recursos compartidos con particiones anidadas, se puede obtener un mensaje que incluye el siguiente texto:

Unable to remove workload nombre_carga_de_trabajo: Attempting to remove a compartment with an unachievably low Fixed policy size. Increase the Fixed policy resource amount and try again.

Solución

Pliegue el dominio de recursos compartidos y elimínelo. A continuación, cree un dominio de recursos compartidos sin el grupo fss cuya eliminación se había intentado.

Tamaño no actualizado para una nPartición cuando se utilizan particiones anidadas

Cuando se supervisa un dominio de recursos compartidos con particiones virtuales dentro de una nPartición en un sistema HP-UX 11i v1, el tamaño supervisado de la nPartición puede no haberse actualizado.

Solución

No es preciso adoptar ninguna acción. Haga caso omiso del valor mostrado para el tamaño de la nPartición de un dominio de recursos compartidos con particiones anidadas en un sistema HP-UX 11i v1.

Mensajes «dangerous REALTIME job» (Trabajo REALTIME peligroso) en syslog

Si instala gWLM A.03.00.00 en un sistema con Integrity VM A.02.00 instalado, obtendrá mensajes con la siguiente forma en syslog:

vm_fssagt[2461]: dangerous REALTIME job 2686 gwlmagent

En lugar de gwlmagent, puede ver parstatus, HPUXChildWrap o wbemexec.

Solución

Puede hacer caso omiso de este mensaje sin que ello comporte ningún riesgo. Estos procesos no son en tiempo real. (Si lo prefiere, puede mejorar a Integrity VM A.03.00, que identifica correctamente estos procesos y no genera este mensaje.)

Mensaje «Information Error During Shutdown» (Error de información durante el cierre)

Puede obtener un mensaje parecido al siguiente:

Information Error during shutdown. The unbinding of objects in the registry may have failed, and the workload management lock has not been released. Associated Exception com.hp.gwlm.common.JniPlatformException: prm_ctrl_rel_cfg_lock failed because vm_fssagt:8343 is the lock owner

Solución

Puede hacer caso omiso de este mensaje sin que ello comporte ningún riesgo.

La administración de grupos fss en sistemas con conjuntos de procesadores restringe los grupos fss

Cuando un sistema tiene conjuntos de procesadores, gWLM utiliza sólo el conjunto de procesadores 0 para los grupos fss. gWLM puede administrar CPU que estén asignadas sólo al conjunto de procesadores 0.

Solución

No hay ninguna solución: simplemente así es como se implementan los grupos fss en un sistema con conjuntos de procesadores. Puede seguir teniendo los grupos fss en el conjunto de procesadores 0 (dejando sin administrar el resto de los conjuntos de procesadores), administrar utilizando en su lugar conjuntos de procesadores (haciendo caso omiso de los grupos fss) o quitar todos los conjuntos de procesadores (que no sean el conjunto de procesadores 0) mediante el siguiente comando:

# psrset -d all

La detección no muestra información actual para los equipos virtuales detenidos

La detección realizada por Global Workload Manager no siempre notifica información actual para los equipos virtuales detenidos. Específicamente, cuando un equipo virtual se detiene y el número de CPU virtuales se modifica, la detección realizada por gWLM no muestra el número modificado de CPU virtuales. En su lugar, muestra el número de CPU virtuales correspondiente al inicio más reciente del equipo virtual.

Solución

Inicie los equipos virtuales antes de efectuar la detección.

Varias tarjetas de interface de red

gWLM, como aplicación de cliente/servidor que es, es más sensible que otros tipos de aplicaciones a la configuración de red del sistema host. gWLM admite la administración sólo en el marco de un dominio de red individual. Por ejemplo, si el sistema host del servidor CMS tiene varias tarjetas de interface de red que están conectadas a varias redes distintas, gWLM necesita que el nombre de host completo resuelva la dirección IP que será accesible por los agentes gWLM que hayan de administrarse.

Este problema constituye una preocupación sobre todo cuando un sistema host está conectado a los dos elementos siguientes:

  • Una red LAN/WAN empresarial a través de una tarjeta de interface de red y una dirección IP

  • Una segunda red interna privada y dirección IP privada para comunicar con otro conjunto determinado de sistemas host (por ejemplo, los miembros de un clúster)

Global Workload Manager intenta detectar y notificar problemas de configuración con la red que puedan acarrear un comportamiento no deseable, pero en algunos casos dicha detección se produce en un contexto del que sólo puede informarse en un archivo de registro.

Solución

Si surge algún comportamiento imprevisto (por ejemplo, un agente gWLM que no consigue actualizar ni informar del estado de sus cargas de trabajo), examine el archivo /var/opt/gwlm/glwmagent.log.0 del sistema host en busca de errores.

No se admiten los alias de nombre de host

gWLM no admite alias de nombres de host. Sólo se admiten nombres de host DNS canónicos (nombres de dominio completos).

Solución

Utilice sólo nombres DNS canónicos al configurar gWLM a través de HP SIM o de un archivo XML utilizado con el comando gwlm.

Los nombres de host están limitados a 64 caracteres

Los nombres de host no pueden tener una longitud superior a 64 caracteres.

Solución

Instale JRE 1.4.2.07 para utilizar nombres de host expandidos (hasta 256 caracteres).

Mensaje «Unable to build a single shared resource domain» (No se puede crear un dominio de recursos compartidos individual)

El siguiente mensaje puede mostrarse en la interface de HP SIM con gWLM:

Unable to build a single shared resource domain from the set of specified hosts: mihostA.midominio.com mihostB.midominio.com

Solución

Este mensaje indica que no hay disponible ningún mecanismo de uso compartido de recursos admitido entre los sistemas host especificados. El mensaje puede obtenerse si:

  • Se han especificado sistemas host en complejos diferentes.

  • Se han especificado sistemas host en nParticiones diferentes de un complejo cuando no hay ningún derecho de uso iCAP para compartir entre las nParticiones.

Si obtiene este mensaje:

  • Inspeccione el archivo /var/opt/gwlm/gwlmagent.log.0 en los nodos administrados indicados en busca de mensajes de error.

  • Si se ha cambiado el nombre de las particiones, reiniciar los agentes del complejo puede subsanar el problema.

Mensaje «Error during discovery of compartments» (Error durante la detección de compartimentos)

El siguiente mensaje puede mostrarse cuando se utiliza el asistente Manage New Systems o el comando gwlm discover:

Error during discovery of compartments.

Asimismo, el archivo /var/opt/gwlm/gwlmagent.log.0 contiene el siguiente mensaje:

com.hp.gwlm.common.PlatformException: /usr/sbin/parstatus -w exited with a non-zero exit status. Captured stderr is: Error: Unable to get the local partition number.

Solución

La causa más probable es que haya una versión anticuada del software nPartition Provider. Global Workload Manager utiliza un comando que aporta nPartition Provider, que normalmente está en todas las versiones de HP-UX, para determinar las capacidades del sistema.

También puede utilizar el comando /opt/vse/bin/vseassist para diagnosticar el problema.

Instale el software de nParticiones más reciente, aun cuando no utilice nParticiones.

Para HP-UX 11i v1, utilice la versión B.11.11.01.03.01.01 o posterior.

Para HP-UX 11i v2 en los servidores HP 9000, utilice la versión B.11.23.01.03.01.01 o posterior.

Para HP-UX 11i v2 en los servidores HP Integrity, utilice la versión B.11.23.01.04 o posterior.

nPartition Provider se facilita en las siguientes ubicaciones:

  • El CD de revisiones de aplicaciones (AR) trimestral a partir de mayo de 2005

  • El sitio web del almacén de software (Software Depot): http://software.hp.com

La configuración de un agente y el servidor CMS no se sincroniza

De vez en cuando, un agente gWLM y el servidor gWLM CMS discrepan sobre si un dominio de recursos compartidos está realmente desplegado o no. Esto puede suceder cuando se utiliza Ctrl-C para interrumpir un comando gwlm deploy o undeploy. También puede suceder si se producen errores al guardar una configuración gWLM: La configuración se despliega y, a continuación, se guarda en el depósito de configuración de gWLM. Si el despliegue se produce pero el almacenamiento no se lleva a cabo, el agente gWLM percibe el dominio de recursos compartidos como desplegado mientras que el servidor CMS lo percibe como plegado.

Solución

Utilice la opción --force con gwlm deploy o gwlm undeploy para sincronizar el agente y el servidor CMS.

Por ejemplo, ejecute el siguiente comando para obligar tanto al agente como al servidor CMS a considerar el dominio de recursos compartidos como desplegado, sustituyendo el dominio de recursos compartidos por el nombre de su dominio de recursos compartidos:

# /opt/gwlm/bin/gwlm deploy --srd=dominio_recursos_compartidos --force

Para obtener más información sobre el comando gwlm, consulte la página de manual de gwlm(1M).

Mensaje «The Lock is Already Held By...» (El bloqueo ya lo mantiene...)

Es posible que se muestre de forma reiterada un mensaje parecido a cualquiera de los dos siguientes:

  • Unable to acquire the repository lock necessary to store changes. The lock is already held by: root(Tue Feb 08 13:11:08 CST 2005). Please retry your operation.

  • Unable to acquire the repository lock necessary to store changes. The lock is already held by: gWLM Agent on host: nombre_host/dirección_IP (Wed May 24 13:20:32 EDT 2006). Please retry your operation.

Solución

Esta situación es normal excepto cuando el bloqueo del sistema (usuario y hora) se mantiene durante más de 10 minutos. Dado el caso, puede levantar el bloqueo deteniendo y reiniciando gwlmcmsd, aunque tal vez tenga que esperar hasta 1 minuto antes de poder utilizar gWLM. Utilice los siguientes comandos:

NOTA: Al detener gwlmcmsd, se deshabilitan Virtualization Manager y Capacity Advisor.
# /opt/gwlm/bin/gwlmcmsd --stop   
# /opt/gwlm/bin/gwlmcmsd

Datos históricos que faltan o imprevistos

Es posible que no disponga de datos históricos a efectos de representación gráfica, aunque tenga la certeza de que se ha desplegado un determinado dominio de recursos compartidos durante el intervalo de tiempo en cuestión.

Se produce un problema afín al seleccionar un intervalo de tiempo en que se espera una actividad elevada del sistema, pero el gráfico muestra una actividad limitada. Asimismo, se podría esperar una actividad muy escasa durante un intervalo de tiempo, pero el gráfico muestra mucha actividad.

Solución

Compruebe que los relojes de sistema del servidor CMS y de todos los sistemas del dominio de recursos compartidos están sincronizados. Si los relojes difieren de forma significativa, es posible que gWLM no pueda hacer coincidir los datos procedentes de los nodos administrados con el intervalo que se trate de representar gráficamente.

Mensaje «Real-Time Data is Currently Loading» (Carga en curso de datos en tiempo real)

Se puede obtener el siguiente mensaje al intentar ver informes en tiempo real:

Real-time data is currently loading, please wait... You might also verify that the remote node is running and SRDs have been deployed.

Solución

Normalmente, esta condición es meramente temporal. Si continúa, compruebe que el demonio gwlmagent se ejecuta en los nodos remotos. Si se ejecuta, deténgalo y reinícielo. Si la condición aún continúa, pliegue y vuelva a desplegar el dominio de recursos compartidos.

Faltan datos en la supervisión en tiempo real

Global Workload Manager podría no mostrar las actualizaciones de supervisión para un dominio de recursos compartidos ni en la línea de comandos ni a través de la interface gráfica del administrador HP SIM. Esto puede deberse a los intentos de reformar el tiempo de espera del dominio de recursos compartidos que han dejado a éste en un estado en que el agente de cada uno de sus nodos administrados debe reiniciarse. También puede deberse a que un nodo administrado está apagado, no ejecuta gwlmagent, o se ha bloqueado.

Si el nodo administrado está apagado o gwlmagent no se ejecuta, obtendrá el siguiente mensaje:

The gWLM agent process on the host is not running -- start the agent and retry.

Si el nodo administrado se ha bloqueado, o el dominio de recursos compartidos necesita que se reinicien todos sus agentes, los síntomas pueder ser:

  • La salida del comando gwlm monitor omite datos de algunos dominios de recursos compartidos

  • La vista de dominios de recursos compartidos de HP SIM muestra varios dominios de recursos compartidos con el error crítico «SRD data is currently stale» (Los datos de los dominios de recursos compartidos están anticuados actualmente).

Solución

Si un dominio de recursos compartidos no proporciona supervisión en tiempo real a lo largo de un periodo de tiempo sostenido, reinicie el agente gWLM en cada nodo administrado del dominio de recursos compartidos.

En el caso de un miembro de dominio de recursos compartidos bloqueado, mientras la supervisión en tiempo real de dicho dominio de recursos compartidos está bloqueada, los demás dominios de recursos compartidos siguen administrando recursos. No obstante, la supervisión en tiempo real de los demás dominios de recursos compartidos se puede bloquear debido al miembro del dominio de recursos compartidos bloqueado. Para restaurar la supervisión de los demás dominios de recursos compartidos:

  1. Pliegue el dominio de recursos compartidos que contenga el miembro bloqueado. Esto puede requerir el uso de la opción --force en el comando gwlm undeploy.

  2. Reinicie gwlmcmsd para borrar la supervisión bloqueada utilizando los siguientes comandos en el servidor CMS:

          # gwlmcmsd --stop
          # gwlmcmsd
          
  3. Cree un dominio de recursos compartidos nuevo para sustituir al plegado, omitiendo el miembro del dominio de recursos compartidos bloqueado.

  4. Después de restaurar el funcionamiento normal del miembro del dominio de recursos compartidos bloqueado, pliegue el dominio de recursos compartidos de sustitución y vuelva a desplegar el dominio de recursos compartidos original para volver al estado original.

El comando gwlm monitor no funciona correctamente

Parece que el comando gwlm monitor no funciona correctamente.

Solución

Especifique explícitamente el dominio de recursos compartidos mediante --srd=dominio_recursos_compartidos cuando utilice gwlm monitor:

# gwlm monitor --srd=dominio_recursos_compartidos
      

Falta una muestra al principio o al final de la salida gwlmreport

Un informe de gwlmreport se basa en un intervalo de informe que empieza a medianoche del día en que comienza el informe y termina a medianoche del día en que concluye el informe. Las muestras que solapan la medianoche al principio o al final del intervalo de informe se excluyen del informe.

Solución

No hay ninguna solución, pero debe tener en cuenta este comportamiento.

La definición de los pesos de directiva en cero produce una asignación asimétrica

Este problema sólo afecta a los agentes gWLM A.02.00.00.x.

Los pesos de directiva ayudan a gWLM a determinar las asignaciones de recursos cuando hay un excedente de recursos. Con los pesos de todas las directivas utilizadas en un dominio de recursos compartidos definidos en el mismo valor, los recursos deberían asignarse equitativamente a las cargas de trabajo asociadas. No obstante, definir los pesos en cero para todas las directivas de un dominio de recursos compartidos hace que se asigne a una sola carga de trabajo todo el excedente de recursos.

Solución

En lugar de cero, utilice un valor de peso de uno.

Una carga de trabajo con una directiva Fixed obtiene más recursos de los solicitados

En un dominio de recursos compartidos con particiones anidadas, la asignación de directivas Fixed (fijas) en las que la suma de los valores fijos sea menor que el mínimo del compartimento primario puede dar lugar a que las cargas de trabajo obtengan más recursos de los especificados en las directivas Fixed.

Solución

Defina las directivas Fixed de modo que el número de CPU solicitado sea mayor que o igual al número mínimo de CPU que necesite el compartimento primario.

Índice de convergencia y directivas OwnBorrow/Utilization

Este problema afecta tanto a los agentes gWLM A.01.01.x como a los agentes gWLM A.02.00.00.x.

El valor de índice de convergencia que se especifica (opcionalmente) al definir una directiva sólo afecta a las directivas Custom (personalizadas). Las directivas OwnBorrow (PropiedadPréstamo) y Utilization (Utilización) no se ven afectadas.

Solución

No hay ninguna solución. No obstante, este problema se aborda en los agentes gWLM A.02.00.01.x.

Se pierden mediciones personalizadas en el redespliegue

Las directivas Custom (personalizadas) utilizan valores de medición que el usuario proporciona a través del comando gwlmsend. Si se redespliega un dominio de recursos compartidos que tenga una directiva Custom, se pierde el valor más reciente de la medición de la directiva. En esta situación, gWLM fundamenta las asignaciones en la solicitud mínima especificada en la directiva de la carga de trabajo. La carga de trabajo también puede obtener los recursos de CPU que queden después de satisfacer todas las directivas.

Solución

Actualice los valores de medición para todas las directivas Custom inmediatamente después de un redespliegue.

Volcado de núcleos de los comandos gwlm

Los intentos de ejecución de gwlm dan lugar a volcados de núcleos cuando /var está lleno.

Solución

La solución a corto plazo consiste en liberar espacio en /var. La solución a largo plazo consiste en actualizar la versión de Java. Si utiliza una variante de Java 1.4.2, compruebe que tiene al menos Java 1.4.2.10. Si utiliza una variante de Java 1.5, no se dispone actualmente de una corrección publicada.

Mensaje «Unable to Create New Native Thread» (No se puede crear un subproceso nativo nuevo)

Se puede mostrar un mensaje con el siguiente texto:

... unable to create new native thread

Solución

Este problema se produce porque los siguientes parámetros del kernel se definen en valores demasiado bajos:

  • max_thread_proc

    Defina max_thread_proc en al menos 256.

  • nkthread

    Defina nkthread para permitir el valor max_thread_proc así como el número de subprocesos que necesiten los demás procesos en el sistema.

Puede haber varios dominios de recursos compartidos basados en particiones virtuales

Normalmente, gWLM no permite crear al mismo tiempo varios dominios de recursos compartidos basados en particiones virtuales en una sola nPartición o sistema. No obstante, cuando hay varios usuarios de gWLM desplegando dominios de recursos compartidos casi al mismo tiempo, gWLM podría permitir por error que existan los diversos dominios de recursos compartidos mencionados.

Solución

Elimine uno de los dominios de recursos compartidos y, a continuación, vuelva a administrar las cargas de trabajo procedentes del dominio de recursos compartidos eliminado colocándolas en los dominios de recursos compartidos restantes.

Sólo se permite desplegar un dominio de recursos compartidos

Puede obtener un mensaje parecido al siguiente:

Error trying to deploy SRD, mysystem.vpar.000 to mysystem2.mydomain.com. SRD, mysystem2.fss.000 is already deployed. Only one SRD is allowed to be deployed.

Solución

Pliegue el dominio de recursos compartidos utilizando la opción --force con el comando gwlm undeploy y reinicie gwlmagent en el nodo administrado.

Una aplicación se bloquea en un grupo fss

En HP-UX 11i v2 (B.11.23), una aplicación ubicada en un grupo fss podría bloquearse al ejecutarse en una partición virtual, nPartición o sistema de un solo procesador.

Solución

Instale el parche PHKL_33052.

Se acepta el mismo valor de orden para diferentes elementos conditionItem

Al definir una directiva condicional en un archivo de configuración XML utilizando el elemento compositePolicyDefinition, se especifican las condiciones con ayuda de los elementos conditionItem. Para cada elemento conditionItem, se especifica un valor de orden que gWLM utiliza para determinar el orden de evaluación. gWLM acepta actualmente el mismo valor de orden para elementos conditionItem diferentes en el mismo elemento compositePolicyDefinition, pero da error al evaluarlos sin notificarlo. gWLM debe generar un mensaje de error en este caso.

Solución

Utilice valores de orden diferentes para cada elemento conditionItem de un elemento compositePolicyDefinition individual.

Las secuencias de comandos no se colocan en las cargas de trabajo correctas

Con los compartimentos basados en conjuntos de procesadores o grupos fss, gWLM permite colocar secuencias de comandos en los compartimentos utilizando los registros de las aplicaciones con nombres alternativos. Esto sólo funciona si el shell o intérprete utilizado está listado en el archivo /etc/shells. Normalmente, perl no se incluye en dicho archivo. Por lo tanto, las secuencias de comandos de perl (y cualquier otra secuencia de comandos basada en shells o intérpretes que no estén listados en /etc/shells) no se colocan correctamente.

Este problema no afecta a los archivos ejecutables.

Solución

Agregue /opt/perl/bin/perl, y cualquier otro shell o intérprete necesario, en el archivo /etc/shells. Global Workload Manager reconocerá los shells o intérpretes agregados en 30 segundos.

NOTA: Puesto que no se necesita el nombre de ruta completo para la secuencia de comandos, un usuario fraudulento podría obtener acceso a los compartimentos basados en conjuntos de procesadores o grupos fss (que, si no, no serían accesibles) utilizando el nombre de la secuencia de comandos para secuencias de comandos o empaquetadores nuevos.

Los procesos se trasladan al conjunto de procesadores por defecto o al grupo fss por defecto

La colocación de todos los procesos con el comando gwlmplace en un nodo administrado se pierde si:

  • El nodo administrado se reinicia.

  • El demonio gwlmagent local se reinicia.

  • Se pliega el dominio de recursos compartidos actual.

En estos casos, los procesos se colocan según los registros de aplicaciones o los registros de usuarios que correspondan. Si no existe ningún registro, los procesos que no sean raíz se colocan en el conjunto de procesadores por defecto o el grupo fss por defecto; los procesos raíz se dejan donde están.

Solución

Para mantener las colocaciones de los procesos entre redespliegues, utilice los registros de aplicaciones o los registros de usuarios de gWLM al crear o modificar las definiciones de cargas de trabajo en gWLM.

Se hace caso omiso de la colocación de procesos mediante psrset

Cuando gWLM administra los conjuntos de procesadores en un sistema, todos los procesos del sistema tienen que ubicarse en una carga de trabajo. gWLM coloca los procesos según los registros de aplicaciones o los registros de usuarios especificados al crear o modificar la definición de una carga de trabajo. Si no existe ningún registro, los procesos están sujetos a las reglas de colocación, que se explican en el tema de la ayuda en línea «pset / fss group tips», en la sección titulada «Precedence of placement techniques».

Si utiliza psrset para colocar los procesos en conjuntos de procesadores, es probable que gWLM traslade los procesos al conjunto de procesadores por defecto.

Solución

Para mantener la colocación de un proceso, utilice los registros de aplicaciones o los registros de usuarios de gWLM al crear o modificar las definiciones de cargas de trabajo en gWLM. Si el uso de registros no resulta práctico, utilice el comando gwlmplace. No obstante, tendrá que utilizar gwlmplace después de cada redespliegue de un dominio de recursos compartidos para volver a ubicar los procesos en las cargas de trabajo deseadas.

No se pueden quitar los grupos fss abandonados

Los grupos fss creados por gWLM se pueden abandonar y su eliminación no resulta fácil. Esta situación se produce por diversos motivos. Por ejemplo, al administrar un dominio de recursos compartidos basado en grupos fss, se utiliza un segundo servidor CMS (quizá porque el servidor CMS original se ha desactivado). Esto puede dejar al dominio de recursos compartidos con grupos fss que no se pueden quitar.

Solución

Mediante la interface HP SIM, puede crear un dominio de recursos compartidos nuevo que integre automáticamente los grupos fss existentes.

También puede eliminar los grupos fss, en cuyo caso tiene varias opciones. Si tiene instalado el administrador PRM, escriba el siguiente comando:

# /opt/prm/bin/prmconfig -r

Si no tiene instalado el administrador PRM, utilice el siguiente procedimiento:

  1. Ejecute la detección:

    # /opt/gwlm/bin/gwlm discover host --file=myfile.xml \
      --type=fss

    donde host es el sistema con los grupos fss.

  2. Importe myfile.xml al depósito de configuración:

    # /opt/gwlm/bin/gwlm import --file=myfile.xml

  3. Determine el nombre del dominio de recursos compartidos ejecutando el siguiente comando y comprobando la salida de los nombres que incluyan host:

    # /opt/gwlm/bin/gwlm list

    Por ejemplo, supongamos que el nombre es host.fss.xyz, donde xyz son números: 0-9.

  4. Despliegue el dominio de recursos compartidos:

    # /opt/gwlm/bin/gwlm deploy --srd=host.fss.xyz

  5. Pliegue el dominio de recursos compartidos:

    # /opt/gwlm/bin/gwlm undeploy --srd=host.fss.xyz

Los grupos fss ya deberían haber desaparecido del sistema. No obstante, las definiciones de las cargas de trabajo correspondientes aún están en el depósito de configuración de gWLM. Dichas definiciones y la definición de dominio de recursos compartidos se pueden eliminar utilizando la interface de gWLM en el administrador HP SIM. Seleccione Tools->VSE Management y haga clic en la ficha Shared Resource Domain. Seleccione el dominio de recursos compartidos con los grupos fss y, a continuación, seleccione Delete->Shared Resource Domain.

Los tamaños o asignaciones para los equipos virtuales son inferiores a los mínimos de directiva

Los tamaños o asignaciones para los equipos virtuales de un dominio de recursos compartidos desplegado pueden aparentar ser inferiores a los mínimos de directiva correspondientes.

Solución

Espere unos cuantos minutos, ya que gWLM puede tardar varios minutos en reconocer la transición de un equipo virtual entre los estados de apagado y encendido.

Tamaño actual negativo para NONVM

Si las CPU de un sistema VM Host se suscriben por exceso al desplegar un dominio de recursos compartidos en dicho host, gWLM muestra el tamaño actual de NONVM como un valor negativo.

Solución

Se dispone de dos opciones:

  • Ajuste las concesiones de los equipos virtuales que estén encendidos para que las CPU no se suscriban por exceso.

  • Detenga uno o varios equipos virtuales hasta que los que aún estén encendidos no suscriban por exceso las CPU.

Al dejar de administrar un equipo virtual encendido, se deja plegado un dominio de recursos compartidos

Al intentar dejar de administrar un equipo virtual que se haya iniciado, el dominio de recursos compartidos se puede plegar, aun cuando se muestre el siguiente mensaje:

The virtual machine nombre_equipo_virtual on host nombre_host is on but does not have an associated gWLM policy. Please turn the virtual machine off, or apply a gWLM policy to provide the necessary resources.

Solución

Apague el equipo virtual y redespliegue el dominio de recursos compartidos que lo contenía.

Extensiones de archivos de registro diferentes de .log.0, .log.1 y .log.2

Global Workload Manager se ha diseñado para utilizar las extensiones de archivos .log.0, .log.1 y .log.2 para los archivos de registro. Se utiliza el bloqueo de archivos Java para asegurar que hay sólo un proceso gWLM actualizando un archivo de registro en cualquier momento dado. A partir de Java 1.4.2.06, el bloqueo de archivos permite crear archivos con extensiones que presentan la forma .log.0.n, donde n es algún entero.

Solución

Si utiliza Java versión 1.4.2.06 o posterior y desea consultar los archivos de registro en busca de mensajes de error, utilice el siguiente comando para ver qué archivos contienen mensajes de error recientes:

# /bin/ls -ltr /var/opt/gwlm/*log*

A continuación, puede utilizar /usr/bin/tail para ver mensajes en los archivos de registro actualizados recientemente.

Si envía los archivos de registro al servicio de soporte técnico de HP, cree un archivo con formato tar mediante los siguientes comandos:

# cd /
# tar cvf /tmp/gwlmlogs4support.tar var/opt/gwlm/*log*

A continuación, envíe el archivo /tmp/gwlmlogs4support.tar al servicio de soporte técnico de HP.

Versión para imprimir
Declaración de privacidad El uso de este sitio implica la aceptación de sus términos de uso
© 2006-2007 Hewlett-Packard Development Company, L.P.