HA 故障切换保持计时器

HA 故障切换保持计时器

Created On 09/26/18 13:53 PM - Last Modified 06/05/23 20:26 PM



在 HA 主动/被动群集中的某个设备故障转移后, 即使其中一个监视接口关闭一分钟, 新的活动设备也不会下降。


在故障转移后的一分钟 "监视器保持计时器" 是一个预先设置的计时器, 以防止不必要的故障转移到襟翼。故障转移后, 如果在一分钟计时器限制中检测到通信链路, 该进程将不允许进行其他故障转移。计时器过期后的链接将随后导致故障转移。   此计时器不可配置。

在以下情况下, 当设备激活到21:53:00 时, ethernet1/2 在21:53:10 之间断开连接。
但是由于监视器保持计时器, 无法检测到链接. 在 21:54:00, 链路监视器在监视器保持计时器结束的同时检测到一个接口。

-ha_agent 日志
11月21日 21:53:00 HA 小组 15: 从状态被动移动到状态活跃<--- this box became active!! this="" box="" became=""></--- this box became active!!>

11月21日 21:53:00 ha_sysd_dev_state_update (ha_sysd: 1402): 将开发状态设置为 "活动"

11月21日 21:53:00 ha_state_start_preemption_hold (ha_state: 1705): 组 15: 不需要抢占等待

11月21日 21:53:00 ha_state_start_monitor_hold (ha_state: 940): 启动监视器保持15组;linkmon 未监视<---- monitor hold timer started!!! monitor="" hold="" timer=""></---- monitor hold timer started!!!>

<-- around 21:53:10 ethernet1/2 went down for flapping, but it's not detected due to monitor hold timer. around="" 21:53:10="" ethernet1/2="" went="" down="" for="" flapping,="" but="" it's="" not="" detected="" due="" to="" monitor="" hold=""></-- around 21:53:10 ethernet1/2 went down for flapping, but it's not detected due to monitor hold timer.>

11月21日 21:54:00 ha_state_monitor_hold_callback (ha_state: 1539): 组 15: 结束监视器保持<--- ending monitor hold timer!!! ending="" monitor="" hold=""></--- ending monitor hold timer!!!>

11月21日 21:54:00警告: ha_event_log (ha_event:47): ha 组 15: 链接组 "大众-显示器" 链接 "ethernet1/2" 已关闭

11月21日 21:54:00警告: ha_event_log (ha_event:47): ha 组 15: 链路组 "大众-显示器" 故障;一个或多个链接已关闭
<-- Link monitor (VW-monitor) detected link down just after monitor hold timer. link="" monitor="" (vw-monitor)="" detected="" link="" down="" just="" after="" monitor="" hold=""></-- Link monitor (VW-monitor) detected link down just after monitor hold timer.>

11月21日 21:54:00 ha_state_transition (ha_state: 982): 组 15: 过渡到状态非功能性

11月21日 21:54:30 ha_state_start_nonfunc_hold (ha_state: 2021): 开始 nonfunc holdtime 15 组
<--- then "monitor fail hold timer" started!!! then="" "monitor="" fail="" hold="" timer"=""></--- then "monitor fail hold timer" started!!!>

另一个 NonFunc 计时器称为 "监视器故障控制计时器"。在
从活动状态降级之后, 设备在非功能状态下停留的时间是多少.

CLI 命令:

# 设置 deviceconfig 高可用性组 xx 模式主动无源显示器-故障保持时间

  <value>  <1-60>在链接/路径监视器失败后停留在非功能状态的间隔 (分钟), 默认为1</1-60></value>

所有者: yogihara

