AIOps 경고 "프로세스 메모리 고갈 - 사용자 ID"
5710
Created On 02/15/22 22:38 PM - Last Modified 01/03/25 10:22 AM
Symptom
- "useridd"에 대한 프로세스 메모리 고갈과 관련된 AIOps의 경고
Environment
- 팬-오스
- AIOps
Cause
AIOps는 useridd 프로세스에서 메모리 고갈을 감지했습니다.
Resolution
이 알림을 받으면 아래의 문제 해결 데이터를 수집하고 지원 사례를 여는 것이 좋습니다. 데이터를 수집한 후 지원이 데이터를 분석할 때까지 useridd 프로세스의 메모리 사용량을 낮추기 위한 완화 단계를 따르는 것을 고려하세요.
문제 해결 데이터
-
기술 지원 파일 수집( GUI : 장치 > 지원 > 기술 지원 파일 생성 클릭 )
-
추적 파일을 생성합니다. 다음 CLI 명령의 출력을 수집합니다.
set cli pager off show clock show system software status | match useridd debug software trace user-id
-
코어 파일 생성: 다음 명령의 출력을 수집합니다.
show clock debug software core user-id show system files set cli pager on
참고: 코어 파일을 생성하고 "시스템 파일 표시"를 체크하기 사이에 몇 분간 기다려서 "useridd-20230405152400-10.1.5-h1.tar.gz"와 비슷한 이름의 코어 파일이 /var/cores 디렉토리에 생성되는지 확인하세요( 처음에는 코어 파일이 아직 형성 중이어서 .xml 확장자로 표시되다가 최종적으로 압축되어 .tar.gz 확장자가 되기 전에 .core 확장자로 표시됩니다) .
방화벽 작은 플랫폼인 경우 디스크 공간이 부족하여 코어 파일이 생성되지 않을 수 있습니다.
방화벽 작은 플랫폼인 경우 디스크 공간이 부족하여 코어 파일이 생성되지 않을 수 있습니다.
- Export the core file (PALO ALTO NETWORKS 장치에서 코어 파일을 내보내는 방법) and (코어 파일을 지원팀에 직접 업로드하는 방법 ).
scp export core-file management-plane from useridd-20230405152400-10.1.5-h1.tar.gz to username@host:path
- 참고: 코어 파일은 DEVICE > 지원 아래 UI에서 " 코어 파일 다운로드 "를 클릭하여 다운로드할 수도 있습니다.
- 장치 상태 수집( GUI : 장치>설정>작업-내보내기: 디바이스 상태 내보내기 )
- AIOps에서 아래 데이터를 수집하세요
- 메모리 고갈이 시작된 날짜와 타임스탬프 를 확인하세요.
- 방화벽 의 전반적인 상태를 확인하세요.
- 방화벽 시스템 및 구성 로그( 모니터 > 로그 )에서 문제가 시작될 당시에 이 동작을 유발했을 수 있는 구성 변경, PANOS 업그레이드/다운그레이드 또는 기타 변경 사항이 있는지 확인하세요.
- ( 선택 사항 ) 아래 완화 단계를 수행하는 경우 단계를 완료한 후 다른 기술 지원 파일을 수집합니다.
- 위 데이터로 사례를 개설하세요.
완화 단계
문제가 해결될 때까지 다음 작업 중 하나를 수행하여 user-id의 메모리 사용량을 줄이세요.
메모: 유지 관리 창에서 수행하는 것이 좋습니다..프로세스를 다시 시작할 경우의 잠재적 영향:
-
프로세스가 다시 시작되는 동안에는 사용자 IP 매핑, 그룹 매핑(group mapping), 사용자 ID xmlAPI 요청, 클라우드 디렉토리를 사용할 수 없습니다.
옵션 1 -과도한 메모리를 사용하는 프로세스를 다시 시작합니다(유지 관리 창에서 수행하는 것이 좋습니다)
- Restart the user-id process using below command
debug software restart process user-id
옵션 2 - HA 환경에서(유지 관리 창에서 수행하는 것이 권장됨)
- 활성 및 수동 디바이스 모두에서 "선점형" 모드를 비활성화하고 ( GUI : 장치 > 고가용성 > 일반 > 선거 설정: 선점형 선택 취소 ) 구성 변경 사항을 commit .
- 수동 디바이스 로의 장애 조치(활성 장치에서: 장치 > 고가용성 > 작업 > 로컬 디바이스 일시 중단 클릭)
- Restart the user-id process on the previously Active device (i.e. the current suspended device).
debug software restart process user-id
- CLI 에서 show management-clients를 실행하여 모든 프로세스가 성공적으로 시작되었는지 확인하세요.
> show management-clients
Client PRI State Progress
-------------------------------------------------------------------------
ha_agent 25 init 0
sslmgr 10 init 0
authd 10 init 0
cryptod 10 init 0
dagger 10 init 0 (op cmds only)
cord 10 init 0
logd 10 init 0 (op cmds only)
reportd 10 init 0 (op cmds only)
useridd 10 init 0
distributord 10 init 0
iotd 10 init 0
Overall status: init. Progress: 0
Warnings:
Errors:
참고 : 프로세스를 다시 시작하면 문제가 일시적으로 완화되지만 나중에 동일한 문제가 다시 발생할 수 있습니다.