| 中国 |
|
|
|
![]() |
HP Serviceguard Quorum Server A.02.00 发行说明,第 4 版 > 第 1 章 HP
Serviceguard Quorum Server A.02.00 发行说明,第 4 版兼容信息与安装要求 |
|
开始安装之前,请通读本文档和您所拥有的其他发行说明或 README 文件。 运行 Quorum Server 进程的 HP-UX 或 Linux 系统位于 Quorum Server 为其提供定额服务的群集之外。Quorum Server 使用 TCP/IP,并在端口 1238 上监听从 Serviceguard 节点发出的连接请求。服务器在内存中为每个群集保留一个特定区域,当某个节点获得群集锁时,此区域将会加上相应标记,从而通知其他节点此锁已被“占用”。它可以为多个节点提供定额服务。有关所支持平台的其他信息,请查询《《HP 9000 Servers Configuration Guide》》(可从 HP 代表处获得)。 下表说明了各个 Quorum Server 版本与各个 Serviceguard 版本之间的兼容关系。 请注意,IA64 版本与 PA RISC 版本在功能上是相同的,没有提供适用于 PA RISC 的 Quorum Server A.01.01 版。 有关完整的支持列表,请访问《 docs.hp.com/hpux/ha》 Æ 《Quorum Server》 Æ 《Supportability Matrixes》 and《 Serviceguard》 Æ 《Matrixes》。 表 1-1 Quorum Server 与 Serviceguard 的兼容性
群集配置期间所需运行的 QS 软件,必须安装在与将要运行该群集的节点不同的系统上。上述系统可以是单个的 Linux 或 HP-UX 系统,也可以是单个群集。 如果从早期版本的 Quorum Server 进行更新,请参考下列有关更新的详细说明。 如果要同时将 Quorum Server 和 Serviceguard 更新到 11.14.02 或更高版本,则更新顺序尤其重要。必须先更新 Quorum Server,然后再更新 Serviceguard。请参阅下面的迁移说明。
使用 swinstall 命令将 Quorum Server(产品号 B8467BA)安装到将要运行此 Quorum Server 的系统上。可以将 Quorum Server 安装在其所服务的一个或多个群集之外的节点上。在使用 Quorum Server 锁的群集上只需要安装 Serviceguard 本身。 如果正在从早期版本的 Quorum Server 进行更新,请转至下面的升级说明。 可以通过以下任意一种方式进行安装:
QS 可执行文件 (qs) 安装在 /usr/lbin 目录中。安装完成后,需要在将要运行 QS 的服务器上创建一个授权文件,以便允许指定的主机系统获取定额服务。此文件的路径名必须为 /etc/cmcluster/qs_authfile。将所有从此 Quorum Server 访问定额服务的群集节点的名称写入该文件中。每个节点占一行,如下所示:
如果要允许所有节点进行访问,请输入一个加号 (+)。 同时,为 QS 日志文件创建一个目录。推荐的路径名位于表 1-3 “qs-pkg 程序包控制脚本参数” 中(可能需要创建该目录)。 A.02.00 版包括一些很少的更新,用于支持 HP-UX 和 Linux 的新版本。这些更新不会对功能有所更改。下载该软件时,您可以先指定操作系统,然后即可自动获得正确的版本。 Linux 上的安装命令使用完整版本号,例如,A.02.00.03。安装前,可以在文件名中看到该完整版本号;安装后,可以使用以下命令获得该版本号: 要在 Red Hat Linux 或 SuSE Linux 上安装软件,请将安装 CD 放入 CD ROM 驱动器,进入 Quorum Server 目录,再进入您的操作系统所对应的目录。您会在该文件中看到此完整产品号。对该产品名(如 A.02.00.03)运行 rpm 命令,您可以输入: # cd /mnt/cdrom/QuorumServer/Linux/ ... (Red Hat) # rpm -i qs-A.02.00.03-0.product.redhat.i386.rpm (SuSE) # rpm -i qs-A.02.00.03-0.product.suse.i386.rpm 在 Red Hat 上,Quorum Server 可执行文件 (qs) 安装在 /usr/local/qs/bin 目录中;而在 SuSE 上,则安装在 /opt/qs/bin 目录中。 安装完成后,需要在将要运行 QS 的服务器上创建一个授权文件,以便允许指定的主机系统获取定额服务。此文件的路径名必须为: Red Hat:/usr/local/qs/conf/qs_authfile SuSE:/opt/qs/conf/qs_authfile 将所有从此 Quorum Server 访问群集服务的群集节点的名称写入该文件中。每个节点占一行,如下所示:
如果要允许所有节点进行访问,请输入一个加号 (+)。 同时,为 QS 日志文件创建一个目录。推荐的路径名位于表 1-3 “qs-pkg 程序包控制脚本参数” 中(可能需要创建该目录)。 可以在另一群集上将 Quorum Server 作为程序包运行。 在一个群集上运行的 QS 程序包最多可以为 50 个群集提供定额服务,但条件是所有群集中的节点总数不能超过 100。 先前并不支持两个群集相互拥有对方的 Quorum Server。而现在则可以做到这一点。如果您拥有有限数量的群集,并且希望对该方法进行一番探究,请参阅名为《《Cross-cluster Quorum Server Configurations》》白皮书,该白皮书可从 《docs.hp.com/hpux/ha》 Æ 《Quorum Server》 查阅。 要将 Quorum Server 配置为一个程序包,并使用 QS 作为受监视的服务,请执行下列步骤:
执行下列群集操作时,Quorum Server 必须处于运行状态:
缺省情况下,Quorum Server 实时消息输出到 stdout 和 stderr 文件。建议创建一个目录,再将 stdout 和 stderr 重定向到此目录中的某个文件,例如:/var/adm/qs/qs.log。推荐的路径名位于表 1-3 “qs-pkg 程序包控制脚本参数” 中。 必须具有超级用户权限才能执行 Quorum Server。在单个系统上,可以将 Quorum Server 配置为当其所在的系统重新启动或重新引导时启动。通过在 /etc/inittab 文件中创建如下项可实现此功能:
qs:345:respawn:/usr/lbin/qs >> /var/adm/qs/qs.log 2>&1
qs:345:respawn:/usr/local/qs/bin/qs >> /var/log/qs/
qs:345:respawn:/opt/qs/bin/qs >> /var/log/qs/qs.log 2>&1 如下所示启动 Quorum Server: # init q 命令完成后,将出现提示信息。 通过检查 qs.log 文件验证 Quorum Server 是否正在运行(推荐的日志路径名位于表 1-3 “qs-pkg 程序包控制脚本参数” 中)。 对于 HP-UX,输入:# cat /var/adm/qs/qs.log 对于 Linux,输入:# cat /var/log/qs/qs.log 日志中应包含如下条目,表明 Quorum Server 已经启动:
Serviceguard 将按照群集配置中的 QS_POLLING_INTERVAL 参数所确定的时间间隔,对 Quorum Server 进行探查。Quorum 探查时间间隔 QS_POLLING_INTERVAL 的缺省值为 5 分钟,最小值为 10 秒钟。 如果 Quorum Server 进程关闭,而其节点仍处于运行状态,则 Serviceguard 群集节点可以检测到 Quorum Server 进程暂停。它会每隔 10 秒钟重新连接一次 Quorum Server,直到 Quorum Server 恢复运行且连接成功为止。在这段时间内,如果需要使用此 Quorum Server 作为仲裁器,群集将暂停。 但是,如果 Quorum Server 的节点处于关闭状态,Serviceguard 将不能立即检测到与该进程的连接断开这一情况。Serviceguard 会继续按配置的时间间隔进行轮询。等到下次轮询完成后,它才会发现此 Quorum Server 连接已关闭。如果在下次轮询之前群集开始重组,Serviceguard 将会假定此 Quorum Server 已关闭。由于它要使用此 Quorum Server 作为仲裁器,因此它会暂停此群集。即使在重组之前或重组期间此 Quorum Server 恢复运行,Serviceguard 也不能将此 Quorum Server 视为已启动,直到下次轮询为止。 此轮询时间间隔的最小值为 10 秒。如果减小 QS_POLLING_INTERVAL 的值,则 Serviceguard 会更早地检测到 Quorum Server 节点故障,但同时也会因轮询过于频繁而增加 Quorum Server 上的负载。如果设置比较短的时间间隔,则可能需要减少使用 Quorum Server 的群集和(或)节点的数目来降低此负载。对于 SgeFF (Serviceguard Extension for Faster Failover) 产品,尤其需要减少所支持的节点或群集的数目,在该产品中,获得锁的时间也设置地非常短。如果此值设置得很短,则应该对其进行严格测试,以便精确调整所有定时参数,该测试应针对在与实际生产环境类似的环境下运行的群集来进行。 需要在群集配置 ASCII 文件中配置 Quorum Server。请执行如下命令获得包含 Quorum Server 参数的群集 ASCII 文件: # cmquerycl -q <QS 主机> -n <节点 1> -n <节点 2> -C 将在群集配置 ASCII 文件中包含 QS_HOST、QS_POLLING_INTERVAL 和 QS_TIMEOUT_EXTENSION 参数。系统基于 Serviceguard 参数(包括 NODE_TIMEOUT 和 HEARTBEAT_INTERVAL)来计算缺省 QS 的超时值。如果出现 Quorum Server 超时,您可以增加这些参数的值,也可以使用群集配置 ASCII 文件中的 QS_TIMEOUT_EXTENSION 来增加 Quorum Server 超时值。这样,将延长 SG 为访问 QS 节点而允许的时间。
有关在群集配置期间标识 Quorum Server 的更多信息,请参考“安装 Quorum Server”。 Quorum Server 在启动时读取授权文件。 HP-UX 中的授权文件是 /etc/cmcluster/qs_authfile。 Linux Red Hat 中的授权文件是 /usr/local/qs/conf/qs_authfile。 如果修改此文件,则需要运行以下命令强制重新读取此文件。
可以在群集运行时将 Quorum Server 从早期版本更新到 A.02.00。 在将 Serviceguard 更新到 11.14.02 或更高版本之前,必须完成 Quorum Server 的更新。
执行下列步骤更换出现故障的 Quorum Server 系统。如果执行这些步骤,则无需更改任何群集节点的配置。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||