HA フェイルオーバー・ホールド・タイマ
Resolution
問題
HA アクティブ/パッシブクラスタ内のいずれかのデバイスのフェイルオーバー後、1分間監視インタフェースのいずれかがダウンしても、新しくアクティブになったデバイスはダウンしません。
解決方法
フェイルオーバー後の1分間の「モニタホールドタイマ」は、不要なフラップのフェイルオーバーを防止するための事前設定タイマです。フェールオーバー後、1分間のタイマ制限内でトラフィックリンクが検出された場合、プロセスは別のフェールオーバーを許可しません。タイマの有効期限が切れると、リンクがダウンしてフェールオーバーが発生します。 このタイマは構成できません。
次のシナリオでは、デバイスが21:53:00 でアクティブになった後、ethernet1/2 は21:53:10 で切断されます。
しかし、リンクダウンは、モニターホールドタイマーのために検出されませんでした。21:54:00 では、モニタのホールドタイマが終了すると同時に、リンクモニタがインタフェースを検出しました。
-ha_agent
11 月 21 21:53:00 HA グループ 15: 状態パッシブから状態アクティブに移動<--- this box became active!! this="" box="" became=""></--- this box became active!!>
11月 21 21:53:00 ha_sysd_dev_state_update (ha_sysd c:1402): 開発状態をアクティブに設定
11月 21 21:53:00 ha_state_start_preemption_hold (ha_state c:1705): グループ 15: プリエンプト待機の必要なし
11月 21 21:53:00 ha_state_start_monitor_hold (ha_state c:940): グループ15のモニターホールドを開始します。linkmon が監視されない<---- monitor hold timer started!!! monitor="" hold="" timer=""></---- monitor hold timer started!!!>
<-- around 21:53:10 ethernet1/2 went down for flapping, but it's not detected due to monitor hold timer. around="" 21:53:10="" ethernet1/2="" went="" down="" for="" flapping,="" but="" it's="" not="" detected="" due="" to="" monitor="" hold=""></-- around 21:53:10 ethernet1/2 went down for flapping, but it's not detected due to monitor hold timer.>
11月 21 21:54:00 ha_state_monitor_hold_callback (ha_state c:1539): グループ 15: 終了モニタホールド<--- ending monitor hold timer!!! ending="" monitor="" hold=""></--- ending monitor hold timer!!!>
11月 21 21:54:00警告: ha_event_log (ha_event c:47): ha グループ 15: リンクグループ ' VW-モニタ ' リンク ' ethernet1/2 ' がダウンしています
11月 21 21:54:00警告: ha_event_log (ha_event c:47): ha グループ 15: リンクグループ ' VW-モニタ ' 失敗;1つまたは複数のリンクがダウンしている
<-- Link monitor (VW-monitor) detected link down just after monitor hold timer. link="" monitor="" (vw-monitor)="" detected="" link="" down="" just="" after="" monitor="" hold=""></-- Link monitor (VW-monitor) detected link down just after monitor hold timer.>
11月 21 21:54:00 ha_state_transition (ha_state c:982): グループ 15: 非機能状態への移行
11月 21 21:54:30 ha_state_start_nonfunc_hold (ha_state c:2021): グループ15の nonfunc ホールドを開始
<--- then "monitor fail hold timer" started!!! then="" "monitor="" fail="" hold="" timer"=""></--- then "monitor fail hold timer" started!!!>
もう1つの NonFunc タイマは、「モニタフェイルホールドタイマ」と呼ばれています。
これは、アクティブ状態からダウングレードした後に、デバイスが非機能状態にとどまる時間の長さです。
CLI コマンド:
# セット deviceconfig 高可用性グループ xx モードアクティブ-パッシブモニタ-フェイルホールドダウンタイム
<value> <1-60>リンク/パスモニタエラーの後、非機能状態にとどまる間隔 (分単位)、デフォルト値1</1-60></value>
所有者: yogihara