處理高可用性系統時,良好的標準措施包括謹慎的失效監視,以預防發生失效,或者至少能夠在發生失效時迅速的回應處理。您應監視以下項目是否發生錯誤或警告:
某些監視項目透過簡單的實體檢查就可以完成,不過,最全面的監視動作,就是定期檢視系統所有配置
HA 裝置的日誌檔
(/var/adm/syslog/syslog.log)。發生與某裝置相關的錯誤時,代表需要進行維護。
使用事件監視服務 |
 |
事件監視服務 (Event Monitoring Service,EMS) 讓您可以配置特定裝置及系統資源的監視程式。您可以將警示訊息傳送到管理工作站,以便通知作業人員在發生問題時採取改善措施。例如,您可以配置磁碟監視程式,在非
RAC 套件使用的鏡射容體群組喪失鏡射時立即報告。若需相關資訊,請參閱手冊《Using the Event Monitoring Service (B7612-90009)》。
使用 EMS 硬體監視程式 |
 |
一組硬體監視程式,可監視和報告記憶體、CPU 和許多其他系統的值。若需相關資訊,請參閱《《EMS
Hardware Monitors User's Guide》》(B6191-90020)。
使用 HP
Predictive 監視功能 |
 |
除了回報實際裝置失效的訊息以外,日誌檔也會保留較不嚴重的訊息,經過一段時間的累積,也能指出即將發生的失效。HP
Predictive 能提供相當程度的自動監視功能,自被監視系統的狀態佇列收集資訊,觀察累積的錯誤。這項工具會回報失效,也能夠依據裝置一段時間內特定不嚴重的錯誤統計,以預測失效。在 Serviceguard 叢集中,應該在所有節點上執行
HP Predictive。
HP Predictive 也會直接向 HP 諮詢中心回報錯誤狀況,警告服務支援人員潛在的問題。您可以透過不同的支援合約取得
HP Predictive。若需相關資訊,請洽詢當地 HP 業務代表。