次の項では、動作中のシステム状態を確認し、クラスタのステータスデータ、ログファイル、構成ファイルを調査することによりトラブルシューティングを行う方法について、以下の項目を説明します。
cmquerycl と cmcheckconf の使用
 |
 |  |
 |
 | 注記: クラスタのステータスとクラスタオブジェクトのプロパティを参照するための方法としては、Serviceguard
Manager を使うと便利です。System Management Homepage (SMH) から、トラブルシューティングを行うクラスタを選択します。 |
 |
 |  |
 |
パッケージ IP アドレスの確認 |
 |
netstat -in コマンドを使用すると、LAN の構成を確認できます。ノード ftsys10 の停止後に ftsys9 でこのコマンドを実行すると、パッケージ IP アドレスが一次 LAN の IP アドレスと共に ftsys9 の lan0 に割り当てられていることがわかります。
ftsys9>netstat -in
IPv4:
Name Mtu Network Address Ipkts Ierrs Opkts Oerrs Coll
ni0# 0 none none 0 0 0 0 0
ni1* 0 none none 0 0 0 0 0
lo0 4608 127 127.0.0.1 10114 0 10 0 0
lan0 1500 15.13.168 15.13.171.14 959269 0 33069 0 0
lan0:1 1500 15.13.168 15.13.171.23 959269 0 33069 0 0
lan0:2 1500 15.13.168 15.13.171.20 959269 0 33069 0 0
lan1* 1500 none none 418623 0 55822 0 0
IPv6:
Name Mtu Address/Prefix Ipkts Opkts
lan1* 1500 none 0 0
lo0 4136 ::1/128 10690 10690 |
システムログファイルの確認 |
 |
クラスタマネージャとパッケージマネージャからのメッセージは、システムログファイルに書き込まれます。ログファイルはデフォルトでは/var/adm/syslog/syslog.log に保管されます。 また、パッケージ関係のメッセージはパッケージログファイルに記録されます。パッケージログファイルは、デフォルトではパッケージのディレクトリに格納されます。vi などのテキストエディターや more コマンドを使用すると、ログファイルに記録されているクラスタの履歴を確認できます。
クラスタの問題のトラブルシューティングを行う場合には、各ノードの syslog.log ファイルを参考にしてください。
ログファイルには、以下の情報が記録されています。
クラスタの主要なイベント (エラーが発生した場合、または発生しない場合)
 |
 |  |
 |
 | 注記: Serviceguard の他にも、HP-UX 上で実行される多くの製品が、メッセージの保存に syslog.log ファイルを使用しています。システムログの使用の詳細については、『HP-UX システム管理者ガイド』を参照してください。 |
 |
 |  |
 |
ファイル /var/adm/syslog/syslog.log から抜粋した以下のエントリーは、pkg5_run スクリプトの問題により実行できなかったパッケージを示しています。詳細は pkg5_run.log に記録されています。
Dec 14 14:33:48 star04 cmcld[2048]: Starting cluster management protocols.
Dec 14 14:33:48 star04 cmcld[2048]: Attempting to form a new cluster
Dec 14 14:33:53 star04 cmcld[2048]: 3 nodes have formed a new cluster
Dec 14 14:33:53 star04 cmcld[2048]: The new active cluster membership is:
star04 , star05, star06
Dec 14 17:33:53 star04 cmlvmd[2049]: Clvmd initialized successfully.
Dec 14 14:34:44 star04 CM-CMD[2054]: cmrunpkg -v pkg5
Dec 14 14:34:44 star04 cmcld[2048]: Request from node star04 to start
package pkg5 on node star04.
Dec 14 14:34:44 star04 cmcld[2048]: Executing '/etc/cmcluster/pkg5/pkg5_run
start' for package pkg5.
Dec 14 14:34:45 star04 LVM[2066]: vgchange -a n /dev/vg02
Dec 14 14:34:45 star04 cmcld[2048]: Package pkg5 run script exited with
NO_RESTART.
Dec 14 14:34:45 star04 cmcld[2048]: Examine the file
/etc/cmcluster/pkg5/pkg5_run.log for more details. |
次のエントリーは、パッケージが正常に起動された例です。
Dec 14 14:39:27 star04 CM-CMD[2096]: cmruncl
Dec 14 14:39:27 star04 cmcld[2098]: Starting cluster management protocols.
Dec 14 14:39:27 star04 cmcld[2098]: Attempting to form a new cluster
Dec 14 14:39:27 star04 cmclconfd[2097]: Command execution message
Dec 14 14:39:33 star04 cmcld[2098]: 3 nodes have formed a new cluster
Dec 14 14:39:33 star04 cmcld[2098]: The new active cluster membership is:
star04, star05, star06
Dec 14 17:39:33 star04 cmlvmd[2099]: Clvmd initialized successfully.
Dec 14 14:39:34 star04 cmcld[2098]: Executing '/etc/cmcluster/pkg4/pkg4_run
start' for package pkg4.
Dec 14 14:39:34 star04 LVM[2107]: vgchange /dev/vg01
Dec 14 14:39:35 star04 CM-pkg4[2124]: cmmodnet -a -i 15.13.168.0 15.13.168.4
Dec 14 14:39:36 star04 CM-pkg4[2127]: cmrunserv Service4 /vg01/MyPing 127.0.0.1
>>/dev/null
Dec 14 14:39:36 star04 cmcld[2098]: Started package pkg4 on node star04. |
オブジェクトマネージャログファイルの確認 |
 |
Serviceguard のオブジェクトマネージャデーモン cmomd は、/var/opt/cmom/cmomd.log ファイルにメッセージを記録します。次のように、cmreadlog コマンドを使用してこのメッセージを確認できます。
cmreadlog /var/opt/cmom/cmomd.log
cmomd からのメッセージには、オブジェクトマネージャにデータ (データタイプ、タイムスタンプ等) を要求したプロセスに関する情報も含んでいます。
Serviceguard
Manager ログファイルの確認 |
 |
System Management Homepage (SMH) から、[Tools] をクリックし、[Serviceguard Manager] を選択した後、目的のクラスタを選択して、[表示] -> [操作ログ] を選択します。
システムマルチノードパッケージファイルの確認 |
 |
Veritas Cluster Volume Manager (HP-UX のいくつかのバージョンでサポートされています) を使っていてクラスタの起動時に問題が発生した場合には、システムマルチノードパッケージのログファイルを確認してください。Cluster
Volume Manager (CVM) 3.5 の場合には、このファイルは VxVM-CVM-pkg.log です。CVM 4.1 以降の場合には、このファイルは SG-CFS-pkg.log です。
構成ファイルの確認 |
 |
以下の ASCII 形式の構成ファイルを確認します。
構成ワークシートを参照して、ファイルの内容に記述もれや誤りがないことを確かめます。
パッケージ制御スクリプトの確認 |
 |
パッケージを実行するノードには必ずパッケージ制御スクリプトが存在し、そのスクリプトファイルがすべてのノードで同一であることを確認してください。また、スクリプトがすべてのノードで実行可能であることを確認してください。さらに制御スクリプト名がパッケージ構成ファイルに存在すること、パッケージ構成ファイルで指定されたすべてのサービスがパッケージ制御スクリプトに存在することも確認してください。
各々のパッケージの起動と停止の情報は、パッケージの制御スクリプトログにあります。このログには、パッケージ制御スクリプトの実行の履歴が記録されています。このログはデフォルトでは/etc/cmcluster/package_name/control_script.log に記録されますが、パッケージ構成ファイルの SCRIPT_LOG_FILE パラメータを使って異なるファイルを指定することもできます。このログには、すべてのパッケージの実行と停止が記録されています。パッケージごとに別々の実行/停止スクリプトを記述した場合は、スクリプトごとにログが作成されます。
cmcheckconf コマンドの使用 |
 |
構成の確認に使用する cmcheckconf は、クラスタのトラブルシューティングにも使用できます。
次の例では、2 つのコマンドを使用して、ftsys9 と ftsys10 での既存のクラスタの構成を確認しています。
cmquerycl -v -C /etc/cmcluster/verify.ascii -n ftsys9 -n ftsys10
cmcheckconf -v -C /etc/cmcluster/verify.ascii |
cmcheckconf コマンドでは以下の内容が確認されます。
次の内容に関するクラスタとパッケージの構成パラメータの有効性
cmcheckconf コマンドでは以下の内容は確認されません。
cmscancl コマンドの使用 |
 |
cmscancl コマンドを実行すると、クラスタ内の全ノードに関する情報がレポート形式で表示されるので、IP アドレスやサブネット、ディスクの物理ボリューム名など、各ノードに固有の情報を確かめることができます。cmscancl コマンドを実行すると、実際には全ノードに対して複数の HP-UX コマンドが実行され、その出力が集められて、cmscancl コマンドを実行しているノード上にレポートとして表示されます。
cmscancl コマンドを実行するには、クラスタノードのルートユーザーの .rhosts ファイルを、正しくコマンドが動作するように設定しておく必要があります。設定していない場合には、このコマンドは、すべてのクラスタノードではなく、ローカルノードだけの情報を収集します。
cmsancl コマンドを実行すると、表 8-1 「cmscancl コマンドにより表示される構成データ」に示す構成データがノードごとに表示されます。
表 8-1 cmscancl コマンドにより表示される構成データ
データの内容 | データの収集源 |
|---|
LAN デバイスの構成とステータス | lanscan コマンド |
ネットワークのステータスとインタフェース | netstat コマンド |
ファイルシステム | mount コマンド |
LVM 構成 | /etc/lvmtab ファイル |
LVM 物理ボリュームグループデータ | /etc/lvmpvg ファイル |
全リンクのリンクレベルの接続性 | linkloop コマンド |
バイナリ構成ファイル | cmviewconf コマンド |
cmviewconf コマンドの使用 |
 |
cmviewconf コマンドを使用すると、クラスタが稼働していないときでも、クラスタのバイナリ構成ファイルの内容をチェックできます。コマンドを実行すると、コマンドを実行したノード上にバイナリ構成ファイルの内容が表示されます。
LAN 構成の確認 |
 |
以下のネットワークコマンドを使用して、問題を診断できます。
netstat -in - LAN 構成を調べます。このコマンドにより、各 LAN インタフェースカードに割り当てられたすべての IP アドレスのリストを取得できます。
lanscan - LAN 構成を調べます。このコマンドにより、ノード上の全 LAN インタフェースカードの MAC アドレスとステータスのリストを取得できます。
landiag - LAN カードを表示、診断、およびリセットします。
linkloop - MAC アドレスレベルでの LAN カード間の通信を確認します。たとえば、以下のように入力します。
linkloop -i4 0x08000993AB72 |
すると、以下のようなメッセージが表示されます。
Link Connectivity to LAN station: 0x08000993AB72 OK |
cmscancl - 一次 LAN と待機 LAN が同じブリッジネットにあることを確認できます。
cmviewcl -v - 一次 LAN と待機 LAN のステータスを表示できます。
上記のコマンドを全ノードで使用してください。