HA Failover Hold Timer

HA Failover Hold Timer

37280
Created On 09/26/18 13:53 PM - Last Modified 06/05/23 20:26 PM


Resolution


Problem

Nach dem Failover eines der Geräte in einem ha Active/Passive Cluster geht das neu aktive Gerät auch dann nicht runter, wenn eine der Überwachungsschnittstellen für eine Minute heruntergeht.

Lösung

Der einminütige "Monitor Hold Timer" kurz nach Failover ist ein Pre-Set-Timer, um unnötigen Ausfall über Klappen zu vermeiden. Nach einem Ausfall wird der Prozess keinen anderen Failover erlauben, wenn er den Traffic-Link innerhalb der einminütigen Timer-Grenze erkennt. Ein Link nach dem Auslaufen des Timers führt anschließend zu einem Failover.   Dieser Timer ist nicht konfigurierbar.

Im folgenden Szenario wird Ethernet1/2 einmal unter 21:53:10 getrennt, nachdem das Gerät bei 21:53:00 aktiv wurde.
Aber der Link nach unten wurde nicht durch den Monitor-Hold-Timer erkannt. Bei 21:54:00 erkannte der Link-Monitor eine Schnittstelle nach unten, während der Monitor-Timer endet.

-ha_agent. log
Nov 21 21:53:00 ha Gruppe 15: von Staat passiv in Staats aktiv versetzt<--- this box became active!! this="" box="" became=""></--- this box became active!!>

Nov 21 21:53:00 ha_sysd_dev_state_update (ha_sysd. c:1402): setzen Sie dev-Zustand auf aktiv

Nov 21 21:53:00 ha_state_start_preemption_hold (ha_state. c:1705): Gruppe 15: kein Bedürfnis nach Preemption warten

Nov 21 21:53:00 ha_state_start_monitor_hold (ha_state. c:940): Start Monitor Hold für Gruppe 15; linkmon nicht überwacht<---- monitor hold timer started!!! monitor="" hold="" timer=""></---- monitor hold timer started!!!>

<-- around 21:53:10 ethernet1/2 went down for flapping, but it's not detected due to monitor hold timer. around="" 21:53:10="" ethernet1/2="" went="" down="" for="" flapping,="" but="" it's="" not="" detected="" due="" to="" monitor="" hold=""></-- around 21:53:10 ethernet1/2 went down for flapping, but it's not detected due to monitor hold timer.>

Nov 21 21:54:00 ha_state_monitor_hold_callback (ha_state. c:1539): Gruppe 15: Ende Monitor Hold<--- ending monitor hold timer!!! ending="" monitor="" hold=""></--- ending monitor hold timer!!!>

Nov 21 21:54:00 Warnung: ha_event_log (ha_event. c:47): ha Gruppe 15: Link Gruppe ' VW-Monitor ' Link ' Ethernet1/2 ' ist down

Nov 21 21:54:00 Warnung: ha_event_log (ha_event. c:47): ha Gruppe 15: Link Gruppe ' VW-Monitor ' Versagen; ein oder mehrere Links sind unten
<-- Link monitor (VW-monitor) detected link down just after monitor hold timer. link="" monitor="" (vw-monitor)="" detected="" link="" down="" just="" after="" monitor="" hold=""></-- Link monitor (VW-monitor) detected link down just after monitor hold timer.>

Nov 21 21:54:00 ha_state_transition (ha_state. c:982): Gruppe 15: Übergang zur staatlichen nicht-funktionalen

Nov 21 21:54:30 ha_state_start_nonfunc_hold (ha_state. c:2021): Start nonfunc Haltbarkeit für Gruppe 15
<--- then "monitor fail hold timer" started!!! then="" "monitor="" fail="" hold="" timer"=""></--- then "monitor fail hold timer" started!!!>

Ein weiterer nonfunc-Timer ist als "Monitor Fail Hold Timer" bekannt.
Es ist die Zeitspanne, in der ein Gerät nach einer Herabstufung aus einem aktiven Zustand in einem nicht funktionierenden Zustand bleibt.

CLI Command:

# Set DeviceConfig hoch Verfügbarkeits Gruppe XX Mode aktiv-passiver Monitor-Fail-Halt-Zeit

  <value>  <1-60>Intervall in Minuten, um in nicht-funktionalem Zustand nach einem Link/Pfad-Monitor-Ausfall zu bleiben, Standard 1</1-60></value>

Besitzer: Yogihara



Actions
  • Print
  • Copy Link

    https://knowledgebase.paloaltonetworks.com/KCSArticleDetail?id=kA10g000000Cly2CAC&lang=de&refURL=http%3A%2F%2Fknowledgebase.paloaltonetworks.com%2FKCSArticleDetail

Choose Language