医管局节点时进入假死状态由于抢占循环?
127987
Created On 09/25/18 19:54 PM - Last Modified 10/05/23 23:47 PM
Resolution
问题:
医管局节点移动到由于抢占循环"挂起"状态。
一个节点可以进入挂起状态由于抢占循环在一个安装程序包括以下内容:
- 各个节点都配置的优先级值和先发制人地主张区分优先级的单个节点。
- 在单个节点上配置链接监视或路径监视。
暂停 (抢占检测到循环)
原因:
下面的事件序列可以导致失败:
- 当一个链接或路径监测 (或两者) 上有源器件的医管局守护进程检测到故障状态,则它移动在非正常工作状态。
- 当还原监控状态时,非功能节点进入被动状态。
- 因为在设置中启用了抢占,无源器件,具有更高的优先级和较低的值,将移动到活动状态。
- 如果进一步遇到故障条件的情况下,如链接或路径监测,主动节点会继续从活动而改变其状态 > 非功能性 > 被动 > 活跃。
- 如发现有"襟翼最大数目",节点移动到"挂起"状态由于抢占循环。
皮瓣算当防火墙后它最后离开活动状态 15 分钟内离开活动状态。 此值指示皮瓣前暂停防火墙和被动防火墙接管 (范围 0-16,默认 3) 允许的最大数目。
* 最大数量的襟翼可以配置如下:
解决方法:
处于挂起状态的节点只能手动进行功能性 (主动或被动)。
在使节点功能正常之前, 请考虑以下建议:
- 调查和修复问题的接口和/或路径监测皮瓣。如果该节点由功能不稳定的环境中,它将有可能进入挂起状态再次。
- 抢占选项删除节点,直到监控状态是稳定。这将有助于健康的节点保留活动状态,虽然遇到了襟翼的节点将保持非功能性/被动状态进行调查。
- 建议必须将 "被动链路状态" 设置为 "自动", 因为活动设备进入非功能状态, 链路状态关闭, 所有接口将处于关闭状态。节点在处于活动状态之前将不知道该接口的状态。因此, 在状态更改为被动后 (由于预置), 所有接口都出现, 但仍在物理上的接口除外。
这将导致监视再次失败, 并可能导致先发制人循环 (根据上面解释的襟翼最大设置)
如果抢占启用它建议还将设置"被动链接状态"设置为"Auto",以防止上述情况的发生。这将允许系统检测如果接口是物理上下来之前允许抢占若要重新激活设备电 '最' 州保持接口:
你可以使节点功能使用 GUI 或 CLI。
在 CLI 中使用此命令:
> 要求高可用性状态功能
在 GUI 中, 导航到设备 >> 高可用性 > 操作命令 > 使本地设备正常工作.
上述步骤之后,受影响的节点移动进入"被动"状态,并最终导致抢占和其高度优先的"活动"状态。