如何排查与 MLAV 云服务器的连接失败问题
32898
Created On 08/14/24 17:52 PM - Last Modified 07/11/25 15:57 PM
Objective
- 找出防火墙与 MLAV 云服务器之间连接丢失的原因。
- 检索防火墙与 MLAV 云服务器之间的连接
Environment
- 下一代防火墙
- MLAV
Procedure
- 检查防火墙和 MLAV 云服务器之间的连接状态。 运行命令︰
> show mlav cloud-status
示例输出:> show mlav cloud-status MLAV cloud Current cloud server: ml.service.paloaltonetworks.com Cloud connection: disconnected
在某些情况下,您可能会得到以下输出:> show mlav cloud-status Server error : device busy or unavailable
- 检查防火墙和 MLAV 云服务器之间的 TCP 连接状态:
- 检查到 MLAV 云服务器的服务路由,它与为“Palo Alto Networks Services”配置的路由相同。
- 如果使用 默认值 ,则表示它是 管理界面 ,无需在 2.b 中的命令中添加参数 “source”
- 如果它配置为数据平面接口,则添加该接口的 IP 地址作为 ping 的源。
- 使用 ping 命令检查到 MLAV 云服务器的网络可访问性,并解析其 FQDN 的 IP 地址:
- 对于到“Palo Alto Networks Services” 的默认 或 管理 服务路由,请使用以下命令:
ping host ml.service.paloaltonetworks.com
- 对于到“Palo Alto Networks Services”的数据平面接口服务路由,请使用以下命令:
ping source <IP address of the dataplane interface configured as service route to PANW Services> host ml.service.paloaltonetworks.com
- 对于到“Palo Alto Networks Services” 的默认 或 管理 服务路由,请使用以下命令:
- 使用解析的 IP 地址检查 netstat:
show netstat numeric-hosts yes numeric-ports yes | match <IP address of the MLAV cloud server>
确保用作 PANW 服务服务路由的防火墙接口与 MLAV 云服务器之间的设备均未阻止端口 443。
- 检查到 MLAV 云服务器的服务路由,它与为“Palo Alto Networks Services”配置的路由相同。
- 要进一步排除故障,请对用作 PANW 服务服务路由的防火墙接口与 MLAV 云服务器之间的流量执行数据包捕获。 还要检查 devsrv.log 查找与 mlav 相关的错误消息。
less mp-log devsrv.log
- 常见问题和解决方法:
- MLAV 服务器证书验证错误。 如果有设备解密用作 PANW 服务服务路由的防火墙接口与 MLAV 云服务器之间的流量,则可能会出现此问题。 devsrv.log消息将如下所示:
2023-08-28 13:21:23.813 -0400 Error: pan_mlav_get_metadata(pan_mlav_cloud.c:1667): Failed to send metadata query 2023-08-28 13:36:23.882 -0400 Error: pan_mlav_get_ver_from_file(pan_mlav_cloud.c:187): Failed to open file[/opt/pancfg/mgmt/content/pan_threatversion] 2023-08-28 13:36:24.605 -0400 Error: verify_cb(pan_ssl_curl_utils.c:641): Error with certificate at depth: 2 2023-08-28 13:36:24.605 -0400 Error: verify_cb(pan_ssl_curl_utils.c:643): Basic Validation of x509 cert Fail ; Code : 20 2023-08-28 13:36:24.606 -0400 Error: verify_cb(pan_ssl_curl_utils.c:652): Failed to validate x509 cert from ctx: (20) unable to get local issuer certificate 2023-08-28 13:36:24.606 -0400 Error: pan_mlav_send_query(pan_mlav_cloud.c:1394): Failed to send req type[3], curl error: Peer certificate cannot be authenticated with given CA certificates在这种情况下,系统日志将显示以下消息:2023/08/08 16:07:21 high tls tls-X50 0 MLAV Server certificate validation failed. Dest Addr: ml.service.paloaltonetworks.com, Reason: unable to get local issuer certificate分辨率:其中一种解决方案是从解密中排除 *.paloaltonetworks.com。 - MLAV 身份验证失败。这与一个软件问题有关,该问题仅影响没有威胁防护许可证且运行的 PAN-OS 版本低于 10.0.2 的防火墙。 请注意,防火墙不需要任何许可证即可成功建立与 MLAV 云服务器的连接,并且基于机器学习的防病毒 (MLAV) 功能是在 PAN-OS 版本 10.0.0 的发布中引入的。 在这种情况下,devsrv.log消息将如下所示:
2020-08-12 15:37:02.062 +0800 Error: pan_mlav_get_ver_from_file(pan_mlav_cloud.c:183): Failed to open file[/opt/pancfg/mgmt/content/pan_threatversion] 2020-08-12 15:37:02.203 +0800 Error: pan_mlav_process_http_resp_code(pan_mlav_cloud.c:538): Got HTTP resp code 400 2020-08-12 15:37:02.203 +0800 Error: pan_mlav_resp_parser(pan_mlav_cloud.c:802): Server resp code[400], msglen[71], msg: invalid flatbuffer request: invalid content version (with build number) 2020-08-12 15:37:02.203 +0800 Error: pan_mlav_send_query(pan_mlav_cloud.c:1301): Failed to parse type[3] response 2020-08-12 15:37:02.203 +0800 Error: pan_mlav_get_metadata(pan_mlav_cloud.c:1555): Failed to send metadata query 2020-08-12 15:37:02.203 +0800 Error: pan_mlav_check_model(pan_mlav_cloud.c:1793): Failed to get metadata from cloud 2020-08-12 15:37:02.203 +0800 Error: pan_mlav_req_handler(pan_mlav_cloud.c:1915): meta download s_connection_tries [1] 2020-08-12 15:37:02.203 +0800 mlav force_reconnect is true
在这种情况下,系统日志将显示以下消息:2020/07/24 20:59:32 high general general 0 MLAV: Authentication or Client Certificate failure.分辨率:将防火墙升级到当前建议的 PAN-OS 版本。 - MLAV 未知错误。 在这种情况下,系统日志将显示以下消息:
2022/09/22 20:30:01 medium general general 0 MLAV: Unknown error.
需要进一步调查,特别是检查 devsrv.log。- 如果 devsrv.log 显示以下消息:
2024-07-26 08:49:42.148 +0900 Error: pan_mlav_process_http_resp_code(pan_mlav_cloud.c:558): Got HTTP resp code 404
问题很可能发生在 MLAV 云服务器端。 分辨率: 如果问题仍然存在,请联系客户支持。 - 如果 devsrv.log 显示以下消息:
2022-09-22 20:30:02.513 +0900 Error: pan_mlav_process_http_resp_code(pan_mlav_cloud.c:558): Got HTTP resp code 500 2022-09-22 20:30:02.513 +0900 Error: pan_mlav_resp_parser(pan_mlav_cloud.c:822): Server resp code[500], msglen[244], msg:
此问题很可能与 Good Cloud Platform (GCP) 负载均衡器有关。 分辨率:如果问题仍然存在,请联系客户支持。
- 如果 devsrv.log 显示以下消息:
- MLAV 云错误,所有机器学习引擎都已停止。 在这种情况下,系统日志将显示以下消息:
2022/04/22 15:29:53 high general general 0 MLAV cloud error, all machine Learning engines stopped
devsrv.log将显示以下消息:2022-04-26 07:32:59.061 -0500 Error: pan_mlav_send_query(pan_mlav_cloud.c:1396): Failed to send req type[3], curl error: Couldn't resolve host name
分辨率: 检查防火墙是否正在运行受 PAN-229832 影响的 PAN-OS 版本。此问题从版本 10.1.14、10.2.11、11.0.5 和 11.1.3 开始修复
- MLAV 服务器证书验证错误。 如果有设备解密用作 PANW 服务服务路由的防火墙接口与 MLAV 云服务器之间的流量,则可能会出现此问题。 devsrv.log消息将如下所示:
Additional Information
重要提示:
如果使用命令“debug software restart process device-server”重新启动设备服务器,则需要执行“提交强制”,以便防火墙重新连接到 MLAV 云服务器。
在某些情况下,重新启动 device-server 后跟提交强制可用于尝试重新连接到 MLAV Cloud 服务器。 但是,此过程可能会造成中断,因此建议谨慎使用此方法,最好在维护时段内使用。