AIOps アラート「プロセス メモリの枯渇 - ユーザー ID」
5718
Created On 02/15/22 22:38 PM - Last Modified 01/03/25 10:19 AM
Symptom
- 「useridd」のプロセス メモリ枯渇に関する AIOps からの警告
Environment
- パンOS
- 人工知能
Cause
AIOps は、 useriddプロセスでメモリ不足を検出しました。
Resolution
このアラートを受け取った場合は、以下のトラブルシューティング データを収集し、サポート ケースを開くことをお勧めします。データが収集されたら、サポートがデータを分析するまで、軽減手順に従って、 useriddプロセスのメモリ使用量を減らすことを検討してください。
トラブルシューティングデータ
-
テクニカル サポート ファイルを収集します ( GUI : デバイス > サポート > テクニカル サポート ファイルの生成をクリック)
-
トレース ファイルを生成します。次のCLIコマンドの出力を収集します。
set cli pager off show clock show system software status | match useridd debug software trace user-id
-
コアファイルを生成する: 次のコマンドの出力を収集します
show clock debug software core user-id show system files set cli pager on
注: コア ファイルの生成と「show system files」の確認の間に数分間待って、/var/cores ディレクトリの下に「useridd-20230405152400-10.1.5-h1.tar.gz」のような名前のコア ファイルが生成されるかどうかを確認します (コア ファイルは、最初はまだ形成中であるため拡張子 .xml で表示され、その後、最終的に圧縮されて拡張子 .tar.gz が付けられる前に拡張子 .core で表示されます) 。
ファイアウォールが小規模なプラットフォームである場合、ディスク容量不足のためコア ファイルが生成されない可能性があります。
ファイアウォールが小規模なプラットフォームである場合、ディスク容量不足のためコア ファイルが生成されない可能性があります。
- Export the core file (PALO ALTO NETWORKS デバイスからコア ファイルをエクスポートする方法) and (コアファイルをサポートに直接アップロードする方法 ).
scp export core-file management-plane from useridd-20230405152400-10.1.5-h1.tar.gz to username@host:path
- 注:コアファイルは、デバイス > サポートの UI から「コアファイルのダウンロード」をクリックしてダウンロードすることもできます。
- デバイスの状態を収集します ( GUI : デバイス>セットアップ>操作 - エクスポート:デバイスの状態をエクスポート)
- AIOpsから以下のデータを収集します
- メモリ枯渇が始まった日付とタイムスタンプを確認します。
- ファイアウォールの全体的な健全性を確認します。
- ファイアウォールのシステムおよび構成ログ ( MONITOR > ログ) から、問題が発生し始めた頃に、この動作を引き起こした可能性のある設定の変更、PANOS のアップグレード/ダウングレード、またはその他の変更が実行されたかどうかを確認します。
- (オプション)以下の緩和手順を実行する場合は、手順を完了した後に別のテクニカルサポートファイルを収集します。
- 上記のデータを使用してケースを開きます。
緩和策
問題が解決するまで、次のいずれかの操作を実行して、ユーザー ID のメモリ使用量を減らしてください。
注記: メンテナンスウィンドウで実行することをお勧めします.プロセスを再開した場合の潜在的な影響:
-
プロセスの再起動中は、ユーザー IP マッピング、グループ マッピング、ユーザー ID XMLAPI要求、クラウド ディレクトリは使用できません。
オプション1 -過剰なメモリを消費しているプロセスを再起動します(メンテナンスウィンドウで実行することをお勧めします)
- Restart the user-id process using below command
debug software restart process user-id
オプション2 - HA環境(メンテナンスウィンドウで実行することを推奨)では、
- アクティブ デバイスとパッシブデバイスの両方で「プリエンプティブ」モードを無効にし( GUI :デバイス > 高可用性 > 全般 > 選出設定: プリエンプティブのチェックを外す)、設定の変更をコミットする。
- パッシブデバイスへのフェイルオーバー (アクティブ デバイスから:デバイス > 高可用性 > 操作 > ローカルデバイスの一時停止をクリック)
- Restart the user-id process on the previously Active device (i.e. the current suspended device).
debug software restart process user-id
- CLIからshow management-clients を実行して、すべてのプロセスが正常に開始されたことを確認します。
> show management-clients
Client PRI State Progress
-------------------------------------------------------------------------
ha_agent 25 init 0
sslmgr 10 init 0
authd 10 init 0
cryptod 10 init 0
dagger 10 init 0 (op cmds only)
cord 10 init 0
logd 10 init 0 (op cmds only)
reportd 10 init 0 (op cmds only)
useridd 10 init 0
distributord 10 init 0
iotd 10 init 0
Overall status: init. Progress: 0
Warnings:
Errors:
注意: プロセスを再起動すると、問題は一時的に軽減されますが、後で同じ問題が再発する場合があります。