AIOps 警报“进程内存耗尽 - 管理服务器”
13596
Created On 02/15/22 21:21 PM - Last Modified 09/17/24 21:48 PM
Symptom
- 来自 AIOps 的关于“mgmtsrvr”的进程内存耗尽的警报
Environment
- PAN-OS
- AIOps 警报
Cause
A 发现“mgmtsrvr”进程内存耗尽。
Resolution
如果您收到此警报,建议收集以下信息故障排除数据并打开一个支持案例。 收集数据后,考虑遵循缓解措施降低内存使用量mgmtsrvr处理直到支持人员可以分析数据。
故障排除数据
收集技术支持文件(GUI : 设备 > 支持点击生成技术支持文件)
使用以下命令生成跟踪文件CLI命令
调试软件跟踪管理服务器
使用以下命令生成核心文件
调试软件核心管理服务器
- 收集的设备状态(GUI :设备>设置>操作-导出:导出设备状态)
- 导出核心文件(HOW TO EXPORT CORE FILES FROM A PALO ALTO NETWORKSDEVICE )
- 从 AIOps 收集以下数据
- 检查 AIOps 指示的日期,了解内存耗尽的开始时间。
- 检查是否有任何配置修改,PANOS升级/降级,或当时可能触发此行为的任何其他更改。
- (选修的) 如果执行减轻下面的步骤,收集另一个技术支持文件完成步骤后
- 使用上述数据打开一个案例。
缓解措施
直到问题解决,您可以重新启动mgmtsrvr处理以降低管理服务器的内存使用情况。NOTE:建议在维护窗口中执行.
重启流程的潜在影响:
- 后PAN-OS10.1、打开mgmtsrvrfirewall充当消息调度程序(类似于panorama), configd, distributed, iotd, logrcvr, pl-dlp_agent, reportd, useridd 等后端守护进程将被重启。
- 之前PAN-OS10.1,以下功能firewall在进程重启期间将不可用,
- UI 和CLI使用权
- HA 同步
- Panorama 推
- 动态更新
- mgmtsrvr 上Panorama作为消息分发器,所有后端守护进程都依赖于mgmtsrvr,当mgmtsrvr重启时,所有后端守护进程都会重启。 通过代理会话对所有防火墙的单一访问点GUI.
选项1 (独立设备)
- 保存并导出候选配置。
- 保存并导出当前配置。
- 执行完整提交
- 使用以下命令重新启动管理服务器进程
debug software restart process management-server
- (为了PAN-OS10.0。X或 10.1。X ) 重新启动设备服务器以确保提交顺利通过。
debug software restart process device-server
选项 2 (设备在主动/被动HA)
- 禁用“抢先”模式(GUI :设备 > 高可用性 > 常规 > 选举设置:取消勾选先发制人)
- 故障转移到无源设备(从有源设备:设备 > 高可用性 > 操作 > 单击暂停本地设备)
- 从重新启动管理服务器CLI从现在挂起的设备(调试软件重启进程管理服务器)
- (为了PAN-OS10.0。X或 10.1。X ) 重新启动设备服务器以确保提交顺利通过。 (调试软件重启进程设备服务器)
- 从CLI跑步显示管理客户以确保所有进程都已成功启动。
> show management-clients
Client PRI State Progress
-------------------------------------------------------------------------
ha_agent 25 init 0
sslmgr 10 init 0
authd 10 init 0
cryptod 10 init 0
dagger 10 init 0 (op cmds only)
cord 10 init 0
logd 10 init 0 (op cmds only)
reportd 10 init 0 (op cmds only)
useridd 10 init 0
distributord 10 init 0
iotd 10 init 0
Overall status: init. Progress: 0
Warnings:
Errors:
NOTE:重新启动流程将暂时缓解流程增长,但问题可能会再次出现。
Additional Information
PAN-175211 - 修复了 (mgmtsrvr) 进程中的内存泄漏问题。 (固定在PAN-OS9.0.16、9.1.13、10.0.9、10.1.4 )
PAN-183774 - 修复了 mgmtsrvr 进程中的内存泄漏问题,该问题导致内存不足 (OOM ) 条件和高可用性 (HA ) 故障转移。 (固定在PANOS9.1.13、10.0.10、10.1.5 )