概要 †
- SteelEye Technology の HA クラスタ ソフトウェア
- Linux, Windows に対応
- GUI のみで構築から運用まで可能
- リソース
- クラスタ ノード間で切り替え可能なリソース
- 仮想 IP アドレス、ファイル システム、アプリケーション ソフトウェアなど
- Parent/Child の依存関係を設定することが出来る
- コミュニケーション パス
- ハートビート用の経路のこと
- 2 つ以上の経路が推奨される
- Core … LifeKeeper の中核機能
- LCD [LifeKeeper Configuration Database] … 構成情報データベース
- LCM [LifeKeeper Communication Manager] … 情報同期やハートビート機能
- ARK [Application Recovery Kit] … リソースの起動・停止・監視・リカバリを行う機能
リンク †
- SIOS Technical Documentation
操作 †
起動 †
server01# /opt/LifeKeeper/bin/lkstart
停止 †
server01# /opt/LifeKeeper/bin/lkstop [option]
オプション | 意味 | 説明 |
-f | | リソースを停止せず、LifeKeeper を停止する |
リソースの操作 †
server01# /opt/LifeKeeper/bin/perform_action -t resource -a action
- resource
- action
- 操作内容
- restore … リソースを起動する (待機系で実行すると、現用系のリソースを停止した上で起動する)
- remove … リソースを停止する
フラグ †
- フラグの作成
server01# /opt/LifeKeeper/bin/flg_create [-d dst] -f flag
- フラグの削除
server01# /opt/LifeKeeper/bin/flg_remove [-d dst] -f flag
- フラグの確認
server01# /opt/LifeKeeper/bin/flg_list [-d dst]
- flag
- shutdown_switchover … シャットダウンコマンドを発行した場合でも Failover する
設定 †
GUI サーバの起動 †
- LifeKeeper の設定は GUI で行う
- LifeKeeper GUI を使用する場合は、GUI サーバを起動させておく必要がある
# lkGUIserver start
GUI クライアントの起動 †
# lkGUIapp
- ログイン アカウントは LifeKeeper の管理ユーザの情報を入力する
リソースの作成 †
- 「Create Resource Hierarchy」ウィザードから作成する
IP †
Generic Application †
Recovery Kit | リソースキットの選択 ここでは Generic Application を選択 |
Switchback Type | |
Server | |
Restore Script | リソースを起動するためのスクリプト |
Remove Script | リソースを停止するためのスクリプト |
quickCheck Script | リソースのステータスを確認するためのスクリプト |
Local Recovery Script | リソースを再起動するためのスクリプト |
Application Information | |
Bring Resource In Service | Yes だとウィザード終了後にリソースの Restore が行われる No だと OSU になる |
Root Tag | リソースのラベル |
設定ファイル †
/etc/default/LifeKeeper †
- 基本設定
LCMHBEATTIME=time
LCMNUMHBEATS=time
- LCMHBEATTIME
- ハードビートの送信間隔 (秒)
- TCP は 1~∞、TTY は 2~∞ (デフォルトは 5 秒)
- LCMNUMHBEATS
- 障害とみなすまでの回数
- 2~∞ (デフォルトは 3 回)
- IP リソース関係の設定
NOBCASTPING=n
NOIPUNIQUE=n
IP_PINGTIME=time
IP_PINGTRIES=n
- NOBCASTPING
- 0 … ヘルスチェックにブロードキャスト PING を使う (デフォルト)
- ただし、Ping List を設定した場合、IP リソース起動後のヘルスチェックは Ping List に対して行われる
- NOIPUNIQUE
- 0 … リソース起動時に同一 IP が存在しないかチェックする (デフォルト)
- IP_PINGTIME
- ヘルスチェックの応答を待つ時間 (デフォルトは 1 秒)
- IP_PINGTRIES
- ヘルスチェックのリトライ回数 (デフォルトは 3)
修正 †
- パラメーターの修正
# lk_chg_value option
- 実行前に LifeKeeper を停止させる
- 変更は両系で行う
オプション | 意味 | 説明 |
-o value | old | 現在の設定値 |
-n value | new | 新しい設定値 |
-v | verbose | 詳細な情報を出力 |
-M | modify | 実際の変更を行わない |
バックアップ †
# /opt/LifeKeeper/bin/lkbackup –c
リストア †
# /opt/LifeKeeper/bin/lkbackup –x -f archive.time.tar.gz
確認 †
ステータス †
server01# /opt/LifeKeeper/bin/lcdstatus -e
BACKUP TAG ID STATE PRIO PRIMARY リソース情報
server02 app_javaapp app_javaapp ISP 10 server01
server02 app_httpd app_httpd ISP 10 server01
server02 app_tomcat app_tomcat ISP 10 server01
server02 ip-10.0.0.1 IP-10.0.0.1 ISP 10 server01
server02 ip-10.0.1.1 IP-10.0.1.1 ISP 10 server01
MACHINE NETWORK ADDRESSES/DEVICE STATE PRIO コミュニケーションパス情報
server02 TCP 10.10.0.1/10.10.0.2 ALIVE 1
server02 TTY /dev/ttyS0 ALIVE --
STATE | 意味 | 説明 |
ISP | In Service Protected | リソースが正常に起動している (Primary 側の通常状態) |
OSU | Out of Service Unimpaired | リソースが正常に停止している (Backup 側の通常状態) |
ISU | In Service Unprotected | リソースは起動しているが、Failover できない状態 |
OSF | Out of Service Failed | リソースの起動に失敗した状態 |
ILLSTATE | resource in ILLegal STATE | リソースの状態を取得できていない状態 |
ログ †
/opt/LifeKeeper/bin/lk_log [option] type
- option
- -f … follow、tail -f と同じ
- -czap … ログをリセットする
- type
- log … 主なイベント ログ
- LCM … LifeKeeper Communication Manager のログ
- GUI … GUI 関連のログ
- remote_execute … リモートからのリクエスト ログ