如果设备在 Prisma 中由于未知原因重启,如何进行故障排除 SD-WAN
Objective
- 客户经常抱怨设备在没有任何人工干预的情况下重新启动。
- 重启原因显示未知
Environment
- 棱镜 SD-WAN
- 棱镜 SASE
- 即时网络
Procedure
可以遵循以下故障排除步骤。
- 从事件日志中检查重启原因。 同样可以从UI警报部分也是如此。 在这种情况下,重启原因未知。
事件:{“_ts”:“2021-04-14T14:13:58.631Z”,“_level”:“信息”,“_pid”:1595,“_msgid”:“重启”,“_prog”:“evd”, "_fac":"事件","_线程":"主要","值":"{\"信息\":{\"原因\":\"未知\",\"详细信息\":\"\ "},\"ident\":\"system\",\"level\":\"critical\",\"timestamp\":\"2021-04-14T14:13:58.577Z\",\" code\":\"DEVICESW_SYSTEM_BOOT\",\"type\":\"alert\",\"site_id\":\"16085738821740117\"}"}
事件:{“_ts”:“2021-04-14T14:42:23.433Z”,“_level”:“信息”,“_pid”:1592,“_msgid”:“重启”,“_prog”:“evd”, "_fac":"事件","_线程":"主要","值":"{\"信息\":{\"原因\":\"未知\",\"详细信息\":\"\ "},\"ident\":\"system\",\"level\":\"critical\",\"timestamp\":\"2021-04-14T14:42:23.379Z\",\" code\":\"DEVICESW_SYSTEM_BOOT\",\"type\":\"alert\",\"site_id\":\"16085738821740117\"}"}
- 为了通过特定时间戳深入了解问题,如果观察到任何异常浪涌,请检查电压和温度。
埃森哲# dump sensor type=temperature type=temperature
时间 core0 core1 core2 core3 系统
(°C ) (°C ) (°C ) (°C ) (°C )
2021-04-14T13:54:12 33 32 33 33 45
2021-04-14T14:09:12 32 32 33 33 45
2021-04-14T14:15:59 32 32 33 33 45
2021-04-14T14:30:59 33 32 33 33 45
时间 1v 5v vcore vddr core0 core1 core2 core3 sys
(毫伏) (毫伏) (毫伏) (毫伏) (°C ) (°C ) (°C ) (°C ) (°C )
2021-04-14T14:09:12 1008 5056 984 1520 32 32 33 33 45
2021-04-14T14:15:59 1008 5056 992 1520 32 32 33 33 45
2021-04-14T14:30:59 1008 5056 992 1520 33 32 33 33 45
- 以上日志没有显示任何异常行为,也CPU/当时发现内存状态正常。
根据所有证据,可以得出结论,重启可能由于以下原因而发生。
- 功率波动。
- 误触电源插座。
Additional Information
我们可能会要求客户获得UPS在这种情况下记录。