跳到内容 中国
HP.com 主页 产品与服务 支持及驱动程序 解决方案 如何购买
» 联系惠普
更多选项
HP.com 主页
使用 Serviceguard Extension for RAC > 第 3 章 维护和故障排除

用 cmviewcl 命令检查群集和程序包状态

» 

技术文档资料

完整的 PDF 手册
» 反馈
内容从此开始:

 » 目录

 » 索引

群集或其组件节点在不同时刻可能会处于几种不同的状态。群集、程序包和其他群集元素的状态信息显示在 cmviewcl 命令的输出以及 Serviceguard Manager 的某些显示窗口中。本节将说明群集或程序包的几种常见状态。

群集状态信息存储在状态数据库中,此数据库在群集中的每个节点上进行维护。可以通过执行 cmviewcl 命令来显示此数据库包含的信息:

cmviewcl -v 

执行命令时使用 -v 选项将显示整个群集的信息。有关 cmviewcl 其他选项的详细说明,请参阅相应的联机帮助页。

提示:在大型配置中,有些命令需用较长时间才能完成。特别是随着程序包和服务数量的增加,可通过运行 cmviewcl -v 命令提高 Serviceguard 的 CPU 利用率。

通过 -r 选项指定所需的版本格式,您也可以指定应按某个早期版本的输出格式进行输出。例如:

cmviewcl -r A.11.16

有关 cmviewcl 其他选项的详细说明,请参阅联机帮助页。

群集和程序包状态类型

群集或其组件节点在不同时刻可能会处于几种不同的状态。以下各节将说明群集或程序包的几种常见状态。

群集状态

群集的状态可以是下列几种状态之一:

  • Up。至少一个节点具有一个正在运行的群集守护程序,并且未重新进行配置。

  • Down。任何群集节点上都没有正在运行的群集守护程序。

  • Starting。群集正在确定其活动成员。至少有一个群集守护程序正在运行。

  • Unknown。执行 cmviewcl 命令的节点不能与群集中的其他节点进行通信。

节点状态

节点的状态可以是“Up”(作为群集中的活动成员),或者是“Down”(作为群集中的非活动成员),这取决于节点的群集守护程序是否正在运行。请注意:从群集的角度看,一个节点的状态可能是“Down”,但该节点仍可能处于活动状态并正在运行 HP-UX。

节点的状态也可以是下列几种状态之一:

  • Failed。节点永远不会觉察到其自身处于这种状态。如果一个节点曾经位于一个活动的群集中,但目前已不再位于此群集中且未被暂停,则此群集中其他活动的成员将发现该节点处于这种状态。

  • Reforming。当群集正在进行重组时,节点处于这种状态。节点当前正在运行的协议可以确保所有节点都承认活动群集中的新成员。如果达成一致,状态数据库将被更新,以便反映新的群集成员。

  • Running。处于这种状态的节点已完成上一次重组所需的全部活动,并正在正常运行。

  • Halted。节点永远不会觉察到其自身处于这种状态。当一个节点正常地离开活动群集(例如执行 cmhaltnode 命令)后,其他节点将发现此节点处于这种状态。

  • Unknown。节点永远不会觉察到其自身处于这种状态。如果节点从来都不是活动群集的成员,其他节点将发现此节点处于这种状态。

程序包状态

程序包控制脚本的状态可以是下列几种状态之一:

  • Up。程序包控制脚本是活动的。

  • Down。程序包控制脚本是非活动的。

  • Unknown

程序包的状态可以是下列几种状态之一:

  • Starting。正在运行控制脚本中的启动指令。

  • Running。服务处于活动状态且在监视中。

  • Halting。正在运行控制脚本中的暂停指令。

程序包切换属性

程序包还具有下列切换属性:

  • Package Switching。启用此选项意味着万一出现故障,程序包可以切换到另一个节点。

  • Switching Enabled for a Node。启用此选项意味着程序包可以切换到引用的节点。禁用此选项意味着程序包不能切换到指定的节点,除非执行 cmmodpkg 命令允许程序包可以切换到此节点。

    每个程序包都针对每个节点标记为“Enabled”或“Disabled”,无论节点对程序包而言是主节点还是代管节点。

组成员状态

Oracle RAC 群集的状态可以是下列几种状态之一:

  • Up。服务处于活动状态且在监视中。成员将显示在 cmviewcl -l goup 的输出中。

  • Down。群集被暂停且 GMS 服务已经停止。成员不会显示在 cmviewcl -l group 的输出中。

下面是一个 cmviewcl 命令的组成员输出示例:

# cmviewcl -l group

GROUP MEMBER PID MEMBER_NODE
DGop 1 10394 comanche
0 10499 chinook
DBOP 1 10501 comanche
0 10396 chinook
DAALL_DB 0 10396 comanche
1 10501 chinook
IGOPALL 2 10423 comanche
1 10528 chinook

其中 cmviewcl 输出的值是:

GROUP 

已配置的组的名称

MEMBER 

组成员的 ID 号

PID 

组成员的进程 ID

MEMBER_NODE 

运行组成员的节点

服务状态

服务具有下列几种状态:

  • Up。服务正被监视。

  • Down。服务没有运行,可能已经暂停或发生故障。

  • Uninitialized。此服务包括在程序包配置中,但未用控制脚本中的run命令启动。

  • Unknown

网络状态

网络接口具有下列几种状态:

  • Up

  • Down

  • Unknown。无法确定接口处于运行状态还是已经停止。群集停止时可能会发生这种情况。备用接口具有此状态。

串行线状态

串行线具有下列几种状态:

  • Up。通过串行线接收到心跳线。

  • Down。在两倍于 NODE_TIMEOUT 值的时间内未通过串行线接收到心跳线。

  • Recovering。通过串行线接收到了已损坏的消息,并且此串行线正在重新进行同步。

  • Unknown。不能确定串行线处于运行状态还是已经停止。远程节点停止时可能会发生这种情况。

故障切换和故障返回策略

程序包的 FAILOVER_POLICY 参数可配置为下列两个值之一:

  • CONFIGURED_NODE。出现故障时,程序包将切换到程序包配置文件的节点列表中的下一个节点。

  • MIN_PACKAGE_NODE。出现故障时,程序包将切换到群集中运行程序包最少的那个节点。

程序包的 FAILBACK_POLICY 参数可以配置为下列两个值之一:

  • AUTOMATIC。当主节点再次可用时,具有这种设置的程序包将在故障切换后返回到其主节点。

  • MANUAL。在故障切换后,具有这种设置的程序包必须由系统管理员将其返回到其原始节点。

故障切换和故障返回策略显示在 cmviewcl -v 命令的输出中。

群集和程序包状态示例

以下 cmviewcl -v 命令的输出样例显示了样例配置中群集的状态。

正常运行状态

一切运行正常;双节点群集上的两个节点都运行正常,每个 Oracle RAC 实例程序包也运行正常。正在运行的程序包只是 Oracle RAC 实例程序包。

CLUSTER      STATUS
example      up
  NODE         STATUS       STATE
  ftsys9       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           56/36.1      lan0
    STANDBY      up           60/6         lan1

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    ops_pkg1     up           running      disabled     ftsys9

      Policy_Parameters:
      POLICY_NAME      CONFIGURED_VALUE
      Start        configured_node
      Failback     manual

      Node_Switching_Parameters:
      NODE_TYPE    STATUS       SWITCHING    NAME
      Primary      up           enabled      ftsys9       (current)

  NODE         STATUS       STATE
  ftsys10      up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           28.1         lan0
    STANDBY      up           32.1         lan1

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    ops_pkg2     up           running      disabled     ftsys10

      Policy_Parameters:
      POLICY_NAME      CONFIGURED_VALUE
      Start        configured_node
      Failback     manual

      Node_Switching_Parameters:
      NODE_TYPE    STATUS       SWITCHING    NAME
      Primary      up           enabled      ftsys10      (current)
      Alternate    up           enabled      ftsys9

Quorum Server 状态

如果群集正在使用 Quorum Server 进行仲裁服务,将在每个节点的条目后显示此服务器的名称和状态,如下列从 cmviewcl -v 命令输出中摘录的内容所示:

CLUSTER      STATUS
example      up

  NODE         STATUS       STATE
  ftsys9       up           running

  Quorum Server Status:
  NAME STATUS STATE
  lp-qs               up           running
...

  NODE         STATUS       STATE
  ftsys10      up           running

  Quorum Server Status:
  NAME STATUS STATE
  lp-qs               up           running

CVM 程序包状态

如果群集正在使用 VERITAS Cluster Volume Manager 进行磁盘存储,系统的多节点程序包 CVM-VxVM-pkg 必须运行于所有活动的节点上,以便应用程序能够访问 CVM 磁盘组。此程序包在 cmviewcl 命令的输出中显示如下:

CLUSTER      STATUS       
example      up

NODE STATUS STATE
ftsys8       down         halted
ftsys9       up running

SYSTEM_MULTI_NODE_PACKAGES:

PACKAGE STATUS STATE
VxVM-CVM-pkg up           running


当使用 -v 选项时,将显示与群集中每个活动节点相关的系统多节点程序包,如下所示:

SYSTEM_MULTI_NODE_PACKAGES:

    PACKAGE STATUS STATE
    VxVM-CVM-pkg up running

     NODE STATUS STATE
     ftsys8       down         halted

     NODE STATUS STATE
     ftsys9       up running
      Script_Parameters:
      ITEM STATUS MAX_RESTARTS RESTARTS NAME
      Service up 0 0 VxVM-CVM-pkg.srv

将程序包移动到另一个节点后的状态

执行下列命令后:

cmrunpkg -n ftsys9 pkg2 

cmviewcl -v 命令将输出如下内容:

CLUSTER      STATUS
example      up

  NODE         STATUS       STATE
  ftsys9       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           56/36.1      lan0
    STANDBY      up           60/6         lan1


    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    pkg1         up           running      enabled      ftsys9

      Policy_Parameters:
      POLICY_NAME      CONFIGURED_VALUE
      Failover     min_package_node
      Failback     manual

      Script_Parameters:
      ITEM         STATUS  MAX_RESTARTS   RESTARTS       NAME
      Service      up          0          0       service1
      Subnet       up          0          0       15.13.168.0
      Resource     up                           /example/float

      Node_Switching_Parameters:
      NODE_TYPE    STATUS  SWITCHING    NAME
      Primary      up      enabled      ftsys9       (current)
      Alternate    up      enabled      ftsys10

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    pkg2         up           running      disabled     ftsys9

      Policy_Parameters:
      POLICY_NAME      CONFIGURED_VALUE
      Failover     min_package_node
      Failback     manual

      Script_Parameters:
      ITEM       STATUS   NAME       MAX_RESTARTS    RESTARTS
      Service      up    service2.1     0           0
      Subnet       up    15.13.168.0    0           0

      Node_Switching_Parameters:
      NODE_TYPE    STATUS    SWITCHING    NAME
      Primary      up        enabled      ftsys10
      Alternate    up        enabled      ftsys9     (current)

  NODE         STATUS       STATE
  ftsys10      up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           28.1         lan0
    STANDBY      up           32.1         lan1

现在,pkg2 是在 ftsys9 节点上运行。注意:此程序包仍然禁止进行切换。

启用程序包切换后的状态

下列命令可将程序包状态改回到“启用程序包切换”状态:

cmmodpkg -e pkg2 

cmviewcl 命令输出如下内容:

CLUSTER      STATUS
example      up

  NODE         STATUS       STATE
  ftsys9       up           running

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    pkg1         up           running      enabled      ftsys9
    pkg2         up           running      enabled      ftsys9

  NODE         STATUS       STATE
  ftsys10      up           running

现在,两个程序包都在 ftsys9 节点上运行,并且 pkg2 启用了切换。ftsys10 节点上正在运行守护程序,且没有运行任何程序包。

暂停节点后的状态

执行下列命令暂停节点 ftsys10 之后:

cmhaltnode  ftsys10 

ftsys9 节点上,cmviewcl 命令将输出如下内容:

CLUSTER      STATUS
example      up

  NODE         STATUS       STATE
  ftsys9       up           running

    PACKAGE      STATUS       STATE        AUTO_RUN    NODE
    pkg1         up           running      enabled      ftsys9
    pkg2         up           running      enabled      ftsys9

  NODE         STATUS       STATE
  ftsys10      down         halted

ftsys9ftsys10 节点上都可得到此输出。

查看 RS232 状态

如果正在使用串行 (RS232) 线作为心跳线连接,则在 cmviewcl -v 命令的输出中将会显示已配置 RS232 设备文件的列表。下面显示的是正常运行时的状态:

CLUSTER      STATUS
example      up
  NODE         STATUS       STATE
  ftsys9       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           56/36.1      lan0
  
    Serial_Heartbeat:
    DEVICE_FILE_NAME      STATUS   CONNECTED_TO:
    /dev/tty0p0           up       ftsys10     /dev/tty0p0
  NODE         STATUS       STATE
  ftsys10      up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           28.1         lan0
  
    Serial_Heartbeat:
    DEVICE_FILE_NAME      STATUS    CONNECTED_TO:
    /dev/tty0p0           up        ftsys9      /dev/tty0p0

下面显示的是串行线不工作时的状态:

CLUSTER      STATUS
example      up
  NODE         STATUS       STATE
  ftsys9       up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           56/36.1      lan0
  
    Serial_Heartbeat:
    DEVICE_FILE_NAME      STATUS       CONNECTED_TO:
    /dev/tty0p0           down         ftsys10  /dev/tty0p0
  NODE         STATUS       STATE
  ftsys10      up           running

    Network_Parameters:
    INTERFACE    STATUS       PATH         NAME
    PRIMARY      up           28.1         lan0
  
    Serial_Heartbeat:
    DEVICE_FILE_NAME      STATUS    CONNECTED_TO:
    /dev/tty0p0           down      ftsys9      /dev/tty0p0

查看无主程序包上的数据

下例中显示的程序包当前是无主的,即这些程序包未运行在任何一个已配置的节点上。被监视资源的信息将提供给每个可以运行程序包的节点,可以使用这些信息确定出现故障的原因并决定在何处重新启动程序包。

UNOWNED_PACKAGES

PACKAGE STATUS STATE AUTO_RUN NODE
PKG3 down halted enabled unowned

Policy_Parameters:
POLICY_NAME CONFIGURED_VALUE
Failover min_package_node
Failback automatic

Script_Parameters:
ITEM STATUS NODE_NAME NAME
Resource up       manx         /resource/random
Subnet up manx         192.8.15.0
Resource up       burmese      /resource/random
Subnet up burmese      192.8.15.0
Resource up       tabby        /resource/random
Subnet up tabby        192.8.15.0
Resource up       persian      /resource/random
Subnet up persian      192.8.15.0

Node_Switching_Parameters:
NODE_TYPE STATUS SWITCHING NAME
Primary up enabled manx
Alternate up enabled burmese
Alternate up enabled tabby
Alternate up enabled persian
打印版本
保密声明 使用本网站表示您同意其使用条件
© 2005 - , Hewlett-Packard Development Company, L.P.