Temporizadores de retención de failover de ha

Temporizadores de retención de failover de ha

37298
Created On 09/26/18 13:53 PM - Last Modified 06/05/23 20:26 PM


Resolution


Incidencia

Después de la conmutación por error de uno de los dispositivos en un clúster activo/pasivo de ha, el nuevo dispositivo activo no se reduce incluso si una de las interfaces de supervisión se apaga por un minuto.

Resolución

El minutero "temporizador de retención del monitor" justo después de la conmutación por error, es un temporizador preconfigurado para evitar fallas innecesarias sobre las solapas. Después de una falla, el proceso no permitirá otro failover si detecta el enlace de tráfico hacia abajo dentro del límite de un minuto de temporizador. Posteriormente, un enlace hacia abajo después de que expire el temporizador provocará una conmutación por error.   Este temporizador no es configurable.

En el siguiente escenario, ethernet1/2 se desconecta a 21:53:10 una vez después de que el dispositivo se haya activado a 21:53:00.
Pero el enlace hacia abajo no se detectó debido al temporizador de retención del monitor. Al 21:54:00, el monitor de enlace detectó una interfaz hacia abajo al mismo tiempo que el temporizador de retención del monitor termina.

-ha_agent. log
Nov 21 21:53:00 ha grupo 15: movido de estado pasivo a estado activo<--- this box became active!! this="" box="" became=""></--- this box became active!!>

Nov 21 21:53:00 ha_sysd_dev_state_update (ha_sysd. c:1402): establece el estado dev en activo

Nov 21 21:53:00 ha_state_start_preemption_hold (ha_state. c:1705): Grupo 15: no hay necesidad de la espera de preferencia

Nov 21 21:53:00 ha_state_start_monitor_hold (ha_state. c:940): iniciando monitor Hold para el grupo 15; linkmon no monitoreado<---- monitor hold timer started!!! monitor="" hold="" timer=""></---- monitor hold timer started!!!>

<-- around 21:53:10 ethernet1/2 went down for flapping, but it's not detected due to monitor hold timer. around="" 21:53:10="" ethernet1/2="" went="" down="" for="" flapping,="" but="" it's="" not="" detected="" due="" to="" monitor="" hold=""></-- around 21:53:10 ethernet1/2 went down for flapping, but it's not detected due to monitor hold timer.>

Nov 21 21:54:00 ha_state_monitor_hold_callback (ha_state. c:1539): Grupo 15: finalización del monitor de retención<--- ending monitor hold timer!!! ending="" monitor="" hold=""></--- ending monitor hold timer!!!>

Nov 21 21:54:00 ADVERTENCIA: ha_event_log (ha_event. c:47): ha grupo 15: Grupo de enlace ' VW-Monitor ' enlace ' ethernet1/2 ' está abajo

Nov 21 21:54:00 ADVERTENCIA: ha_event_log (ha_event. c:47): ha grupo 15: Grupo de enlace ' VW-Monitor ' fallo; uno o más enlaces están abajo
<-- Link monitor (VW-monitor) detected link down just after monitor hold timer. link="" monitor="" (vw-monitor)="" detected="" link="" down="" just="" after="" monitor="" hold=""></-- Link monitor (VW-monitor) detected link down just after monitor hold timer.>

Nov 21 21:54:00 ha_state_transition (ha_state. c:982): Grupo 15: transición al estado no funcional

Nov 21 21:54:30 ha_state_start_nonfunc_hold (ha_state. c:2021): comenzando nonfunc holdtime para el grupo 15
<--- then "monitor fail hold timer" started!!! then="" "monitor="" fail="" hold="" timer"=""></--- then "monitor fail hold timer" started!!!>

Otro temporizador no FUNC se conoce como el "monitor FAIL Hold Timer".
Es la cantidad de tiempo para que un dispositivo permanezca en un estado no funcional después de una degradación de un estado activo.

Comando CLI:

# Set deviceconfig alta disponibilidad grupo XX modo activo-monitor pasivo-FAIL-retención-tiempo

  <value>  <1-60>Intervalo en minutos para permanecer en estado no funcional después de un error de monitor de vínculo/ruta, por defecto 1</1-60></value>

Propietario: yogihara



Actions
  • Print
  • Copy Link

    https://knowledgebase.paloaltonetworks.com/KCSArticleDetail?id=kA10g000000Cly2CAC&lang=es&refURL=http%3A%2F%2Fknowledgebase.paloaltonetworks.com%2FKCSArticleDetail

Choose Language