跳到内容 中国
HP.com 主页 产品与服务 支持及驱动程序 解决方案 如何购买
» 联系惠普
更多选项
HP.com 主页
ServiceGuard OPS Edition A.11.13 版本发行说明 > 第 1 章 ServiceGuard OPS Edition A.11.13 版本发行说明

已知问题和变通办法

» 

技术文档资料

完整的 PDF 手册
» 反馈
内容从此开始:

 » 目录

SR 4701363812:View 操作在 SAM 中显示的信息比 cmviewcl 命令少

  • 问题是什么?在“Package Configuration and Package Administration”子域,View 操作不显示程序包子网和子网状态信息。

  • 变通办法是什么? 更改“Cluster Administration”子域的显示内容。

SR 4701365817:SAM 中未选中的子网缺省情况是要被监视的

  • 问题是什么?在 SAM 中创建或修改群集网络配置时,未选中的子网配置成为被监视的心跳子网。

  • 变通办法是什么?编辑 /etc/cmcluster/cmclconfig.ascii 文件,删除未选中的子网,对编辑完的软件使用 cmapplyconf 命令。

SR 4701365833:命令失败,报告网络分区消息。

  • 问题是什么?cmqueryclcmcheckconfcmapplyconf 命令可能会失败,报告网络分区有问题。使用光纤网络时尤其容易出现这个问题。信息类似如下所示:

    cmcheckconf -v -C ascii_file
    Error:Unable to communicate with node arcus
    Error:Lost contact with arcus
    Error Detected a partition of IP subnet 192.6.145.0.
      Partition 1
         funnel lan0
       Partition 2
         vega lan5
       Partition 3
         rigel lan0
       Partition 4
         mizar lan0
    Error:Detected a partition of IP subnet 192.6.145.0
      Partition 1
         funnel lan5
       Partition 2
         vega lan7
       Partition 3
         rigel lan7
       Partition 4
         mizar lan5
    cmcheckconf   :   Unable to reconcile configuration file
  • 变通办法是什么?重试该命令。如果问题依然存在,则使用 lanscannetstat 命令验证群集联网状态。联网问题解决以后,再使用 cmqueryclcmcheckconfcmapplyconf 命令。

SR 4701377473:卷组活动时磁盘断电

  • 问题是什么?如果群集内任何一个节点上的磁盘卷组活动时磁盘断电,下列命令可能会挂起:cmqueryclcmapplyconfcmcheckconf。这种挂起只有在故障的磁盘上有未镜像的逻辑卷时才会发生。

  • 变通办法是什么?有三种方法可以避免此问题:

    • 在进行下一次配置更改之前修复磁盘或为其加电。

    • 如果卷组中有正在使用的磁盘,在运行上面列出的命令之前,使卷组处于非活动状态。使用 vgchange -a n 命令。

    • 仅使用已镜像的逻辑卷。

SR 4701385617:所允许的无效的资源轮询时间间隔

  • 问题是什么?可能使用 SAM 配置了无效的资源轮询时间间隔。

  • 变通办法是什么?验证您所使用的是有效的资源轮询时间间隔。有关 cmmakepkg(1) 的信息,请参考 SAM 帮助屏幕或“联机帮助”页。另外,您可以使用 cmcheckconfcmapplyconf 命令执行验证,而不是 SAM。

SR 4701385625:节点名不应包含域名。

  • 问题是什么?如果在 HP-UX 安装期间或通过运行 /sbin/set_parms 将节点主机名定义为完整域名,如 maple.cup.hp.com,则 cmquerycl 命令将失败。当节点的主机名包含完整域名时,试图查询节点 maple 时,将显示如下例中所示的消息:

    # cmquerycl -n maple

    Begin checking the nodes...
    Looking for other clusters ...Done
    Gathering configuration information ........Done
    Error:Unable to communicate with node maple
    Error:Unable to determine device configuration:failed to send device query to node maple
    Failed to gather configuration information..

  • 变通办法是什么?使用 /sbin/set_parms 命令将节点主机名设置为只有节点名。如 maple

SR 4701395533:当程序包“正在启动”时 cmhaltpkg 命令运行不正常。

  • 问题是什么?如果在程序包处于“正在启动”状态时发出此命令,则 cmhaltpkg 命令将不能一直工作。

  • 变通办法是什么?运行 cmhaltpkg 命令之前等待程序包完成其启动。

SR 4701406223:系统时间拨慢,则程序包命令挂起

  • 问题是什么?如果通过使用 date(1M) 命令在系统上将系统时间拨慢,则当程序包控制脚本结束时,ServiceGuard OPS Edition 守候进程可能不会正确进行检测。将时间拨回原来的时间之后,程序包命令将能够完成。

  • 变通办法是什么?不支持将系统时间调慢。

SR 8606114618 (JAGac29381):ServiceGuard 记录某些运行脚本退出值的不正确的错误消息。

  • 问题是什么? 如果程序包运行/暂停脚本退出时带有值 7、13 或 19,程序包管理程序不将它们转换成相应的错误信息。

  • 变通办法是什么?不要在脚本中使用退出值。

SR 8606114619 (JAGac29382):程序包管理器不理会程序包暂停脚本的 RESTART 退出值

  • 问题是什么? 如果程序包暂停脚本使用 RESTART(2) 退出,则在暂停程序包后不能重新启动它。

  • 变通办法是什么? 使用 cmmodpkg -e pkgname 命令手工启动程序包。

SR 8606174686 (JAGad43932):如果将 ServiceGuard 修补软件安装一个正使用的群集上,则它无法正常运行

  • 问题是什么? 如果安装 ServiceGuard 修补软件时群集正在使用中,则 ServiceGuard 就不能执行修补软件的功能。

  • 变通办法是什么? 按照下面修补软件中给出的安装指导进行安装:

    1. 暂停将要安装修补软件的节点上的 ServiceGuard。

    2. 在该节点上安装修补软件。

    3. 在该节点上重新启动 ServiceGuard。

    4. 修补软件需要安装在群集中所有的节点上。

    5. 安装过程中,ServiceGuard snmp 子代理将停止运行,并且不能自动重新启动。此子代理主要用于 ClusterView 产品。如果您需要使用它,则执行下述命令可手工重新启动它:

      # /usr/lbin/cmsnmpagt start

SR 8606183590 (JAGad52803):cmmakepkg 的联机帮助页未讲述对于系统多节点程序包可以使用“*”作为 NODE_NAME 的值

  • 问题是什么? cmmakepkg 的联机帮助页没有说明 "*" 是 NODE_NAME 域的有效值,并且必须只用于系统多节点程序包(即 CVM 程序包 VxVM-CVM-pkg)。

  • 变通办法是什么?

    这里有程序包 ascii 文件中关于 NODE_NAME 域的正确的联机帮助页信息:

    NODE_NAME

    节点名是指运行程序包的节点。这个名称必须与群集配置中配置的名称相一致。可指定多个 NODE_NAME 条目。第一个 NODE_NAME 是主节点,接下来指定的节点被认为是备用节点。以特殊的 "*" 形式出现通常用来指定配置程序包运行在所有节点上。目前 "*" 只供特殊的 CVM 程序包 VxVM-CVM-pkg 使用。

SR 8606184097 (JAGad53307):cmrunpkg 命令返回后系统多节点程序包立即处于“Starting”状态

  • 问题是什么? 用于系统多节点程序包的 cmrunpkg 命令不等待程序包在所有节点上都完成。程序包启动后,它立即返回。它不等待所有节点上的程序包启动都完成并且程序包状态变为“Running”。

  • 变通办法是什么? 等候几秒,系统多节点程序包在所有节点上完成启动,然后使用 cmviewcl 命令检查是否为“Running”状态。

SR 8606194924 (JAGad64130):cmviewcl 用于带有大量服务的 60 程序包,会导致 cmcld 使用 50% 的 CPU

  • 问题是什么? 有大量程序包和服务的群集所使用的 cmviewcl -v 命令可能导致 cmcld 占用 50% 的 CPU 资源直至,命令完成。

  • 变通办法是什么? 减少 cmviewcl 命令的使用范畴。例如,只对特殊的程序包发出此命令。

SR 8606185685 (JAGad54887):探查禁用的磁盘时,cmquerycl 命令可能会挂起。

  • 问题是什么? 如果 ServiceGuard 用于探查磁盘的命令(如 cmquerycl)遇到禁用的磁盘,命令可能挂起。

  • 变通办法是什么? 如果整个磁盘配置(LUN 的个数)不大,就等待命令完成,否则使用 CTRL-C 终止命令。

SR 8606202196 (JAGad71370):在有问题的脚本上执行 cmhaltpkg 命令将输出不正确的错误消息

  • 问题是什么? 执行 cmhaltpkg 时,如果程序包控制脚本有问题(不存在的文件、没有执行许可,等等),则在终端上输出如下的错误消息:

    Unknown error returned from daemon:Error 0

  • 变通办法是什么? 检查控制脚本是否存在以及是否设置了正确的文件权限。

OPS 8.1.5 将不能安装

  • 问题是什么? OPS 8.1.5 32 位不能安装在 ServiceGuard OPS Edition A.11.09 版本上。

  • 变通办法是什么?如果您正在从 ServiceGuard OPS Edition A.11.08 或更早版本升级,在安装 ServiceGuard OPS Edition A.11.09 之前,请先安装 OPS 8.1.5 32 位。发行期间,Oracle 研究此问题。有关修复的信息,可与 Oracle 代表机构联系咨询。

OPS 8.x 用户不能显示配置 OPS 用哪个 LAN 通信

  • 问题是什么?OPS 8.x 用户不能显示配置 OPS 用哪个 LAN 通信。OPS 8.x 只会使用 gethostbyname() 返回的第一个 IP,这取决于 DNS 是如何配置的。大多数 OPS 群集都配置有多个 LAN,并且不是每个 LAN 都具有很高的可用性。如果 OPS 用非高可用性的 LAN 在节点间进行通信时,此 LAN 就成为单一故障点。如果此 LAN 失败,OPS 即会挂起。

  • 变通办法是什么? 一种简单的变通方法是确保群集内配置的每个 LAN 都为高可用性的。另一种变通方法是将 OPS 用来通信的 IP 放入 /etc/hosts 文件中,并在使用 DNS 之前将系统配置成通过 /etc/hosts 进行名称解析。这样做的结果就可以使用户能够控制 gethostbyname() 返回的 IP 和 OPS 使用哪个 LAN。

SNMP 配置文件行被注释掉

  • 问题是什么?在以前的版本中,SNMP 14.x 软件会注释掉 get-community-name 参数。更早版本的配置文件也可能将此参数注释掉。

  • 变通办法是什么?编辑 SNMP 配置文件 /etc/SnmpAgent.d/snmpd.conf。取消注释 get-community-name 参数,并将其设置为 public。该行应如下所示:

     get-community-name:public # enter community name

引导/根磁盘应使用优先级较高的 SCSI 地址

  • 问题是什么?如果在共享的 SCSI 总线上为引导/根磁盘配置的优先级较低,在访问引导/根磁盘设备发生超时时,则会发生系统混乱。群集中的同一总线上若配置有许多节点和磁盘,则有可能发生这种情况。

  • 变通办法是什么?确保按下列方式分配 SCSI 地址,群集节点上的接口卡具有的 SCSI 地址优先级最高,其后是任何位于共享总线上的引导/根磁盘,然后是共享总线上的所有其他磁盘。

用户进程优先级不应设置为高于 20

  • 问题是什么? ServiceGuard OPS Edition 群集守候进程运行的优先级为 20。任何高于此优先级的用户进程都有可能影响群集守候进程。如果用户进程优先级较高(小于 20 的数),群集守候进程可能不能更新安全计时器,从而导致节点失败。

  • 变通办法是什么?分配给用户进程的优先级要比群集守候进程的优先级(设置为 20)低。

cmhaltpkgcmhaltnode 不能同时执行

  • 问题是什么?如果同时运行 cmhaltpkg 和 cmhaltnode,则在要暂停的程序包再次重启时,出现一个小的记时窗口。

  • 变通办法是什么?不要同时运行 cmhaltpkgcmhaltnode

SAM 中出现空白的“View All Clusters”屏幕

  • 问题是什么?只有在群集管理子域中,如果 ServiceGuard OPS Edition 不能检索某个群集的配置文件,“View All Clusters”将显示为空白屏幕。此问题影响不大,因为 SAM 不支持任何远程群集配置和管理任务。

  • 变通办法是什么?

    1. 如果需要管理本地群集,则选择“View Local Cluster”

    2. 如果需要查看所有群集的运行时状态信息,则在程序包管理子域中选择“View All Cluster”。

    3. 如果需要查看所有群集的配置信息,则在群集配置子域中选择“View All Clusters”。

打印版本
保密声明 使用本网站表示您同意其使用条件
© Hewlett-Packard Development Company, L.P.