はじめに
このドキュメントでは、MME CPU輻輳時のページングを最適化し、ネットワークの安定性と継続性を確保するページングロジックと拡張機能について詳しく説明します。
問題の説明
eNB/RAN障害によるMMEリソースへのページングストームの影響
大規模なモバイルネットワークでは、ダウンリンクデータがある場合にアイドル状態のユーザ機器(UE)を見つけるには、ページング手順が重要です。この手順には、複数のページング段階と、特定の障害状態でネットワーク全体に拡張されるフォールバックロジックが含まれます。
Evolved Node B(eNB)/Radio Access Network(RAN)レベルでの重大な障害により、重大な問題が観察される可能性があります。この障害では、ページングの第1段階におけるすべてのページング試行が失敗しました。標準的なフォールバックメカニズムに従って、これらのページング障害はページングの段階2にエスカレートされ、次にページングの段階3にエスカレートされ、最終的にページングの段階4で同時にページングが試行されるようになりました。
通常、ネットワークオペレータは、ワイドエリアロジックを使用してページングステージ3とステージ4を設定し、すべてのeNBまたはすべてのトラッキングエリアID(TAI)へのページングをトリガーします。 コントロールプレーン仮想マシン(CPVM)のリロード(Evolved GPRS Tunneling Protocol Control(EGTPC)パスの障害が原因)またはRANが応答しないシナリオでは、フォールバックロジックによりネットワーク全体で大量のページングが発生します。
影響
- このページングの急増により、予期しないページングメッセージの急増と再アタッチ要求が発生し、Mobility Management Entity(MME)マネージャに多大な負荷がかかります。
- CPUとメモリの使用率が高くなり、システムが過負荷状態や警告状態に陥ることが頻繁にあります。
- このような負荷の高い状況では、MMEマネージャ(ページングを処理するMMEのコンポーネント)が「ビジーアウト」状態になり、新しい接続またはセッションを拒否する原因となり、一時的な容量のダウングレードおよびサービスの低下を引き起こします。
ネットワークオペレータにとっての重要なポイント
この事例は、以下の重要性を強調しています。
- ページングのレート制御およびスロットリングメカニズムを実装する。
- CPVMリロード、RANページング応答性、ページング再試行パターンなどの早期インジケータを監視し、負荷を予防的に管理します。
影響のグラフィック表示
ここでは、ページングプロファイルがページングステージ1、2、3、および4から設定されていると仮定します。
これらのグラフは、異なるページング段階でのページングの試行回数と失敗回数の合計を示します。
MMEページングプロファイル第1段階の試行
MMEページングプロファイルStage1の障害
MMEページングプロファイルStage2の障害
MMEページングプロファイル第3段階の試行
MMEページングプロファイル第4段階の試行
MMEマネージャのCPU使用率のグラフ
MMEマネージャのCPU使用率のグラフ
MMEマネージャのメモリ使用率:ログ:
2024-01-11T22:18:10.575996+09:00 UHNxxxmmvm0001 evlogd: [local-60sec10.022] UHN3tte2mmvm0001 [resmgr 14508 error] [17/0/10121 <rmmgr:170> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-8 is way over its memory limit! Allocated 409600K, Using 624696K
2024-01-11T22:18:10.069772+09:00 UHN3xxxmmvm0001 evlogd: [local-60sec9.695] UHN3tte2mmvm0001 [resmgr 14508 error] [8/0/10120 <rmmgr:80> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-6 is way over its memory limit! Allocated 409600K, Using 584680K
2024-01-11T22:18:09.998162+09:00 UHN3xxxmmvm0001 evlogd: [local-60sec9.634] UHN3tte2mmvm0001 [resmgr 14508 error] [10/0/10132 <rmmgr:100> _resource_cpu.c:4421] [software internal system critical-info syslog] The task mmemgr-2 is way over its memory limit! Allocated 409600K, Using 543404K
サンプル コンフィギュレーション
paging-profile paging-ps
paging-stage 1 match-criteria ue-contact-time 1200 action last-n-enb-last-tai max-n-enb 1 t3413-timeout 2 max-paging-attempts 1.
paging-stage 2 match-criteria all action last-n-enb-last-tai max-n-enb 5 t3413-timeout 2 max-paging-attempts 1
paging-stage 3 match-criteria all action all-enb-last-tai t3413-timeout 2 max-paging-attempts 1
paging-stage 4 match-criteria all action all-enb-all-tai t3413-timeout 3 max-paging-attempts 1
MME内でのページングの管理方法

機能ロジック
一般的なページングのロジックを理解しておくことが重要です。特に、重大なページングのシナリオで例外的な状況に対処する場合には、このロジックが重要になります。前述したように、セッションマネージャはページングキャッシュを処理し、TAIマネージャとMMEマネージャ間のマッピングを維持します。このマッピングは、ページング試行/応答が成功するたびに更新されますが、ページング障害が発生した場合は変更されません。最初のページング試行時に、セッションマネージャはすべてのMMEマネージャにページング要求をブロードキャストし、応答を使用してページングキャッシュを構築し、TAI-MMEマネージャマッピングを確立します。
ページングメッセージフロー
キャッシュの構築
Sessmgrは、UEにページングする場合は常に、ページングする必要があるすべてのTACにキャッシュ情報が存在するかどうかを確認します。はいであり、キャッシュエントリが妥当性チェックをパスした場合、Sessmgrはユニキャスト/マルチキャストページング要求を関連するMMEMgrに送信します。「いいえ」の場合、Sessmgrはページング要求をすべてのMMEMgrsにブロードキャストします。これに対して、MMEMgrは、Sessmgrがキャッシュを構築できるように、サービスを提供するページング要求のTACを示す必要があります。
キャッシュの有効性
各キャッシュエントリには、オリジンタイムスタンプが含まれています。キャッシュにアクセスすると、そのキャッシュの作成タイムスタンプと設定されたキャッシュの有効タイムアウトに基づいて検証されます。タイムアウトの期限が切れている場合は、このエントリを使用しないでください。すべてのMMEサービスが停止したときに、キャッシュ全体をクリアする必要があります。
ソリューション
ページング機能を自動的に無効にする方法
前述したように、重要なページング設定で設定されているページングステージだけがトリガーされますが、トリガーはトリガーされません。この機能には、ページングキャッシュの依存関係が存在します。そのため、特定のTAI-MMEマネージャマッピングがSessmgrページングキャッシュにすでに存在する場合、クリティカルページングでは、設定されたページング段階に対してのみページングトリガーが使用されます。ただし、特定のTAIで使用できるTAI-MMEMgrマッピングがない場合、ページング段階で設定されていなくても、後続のページング段階でも試行を確認できます。また、マッピングがページング・キャッシュの下に構築されると、クリティカル・ページングの通常のロジックが実行されます。
コンフィギュレーション
mme-manager
congestion-control cpu-utilization threshold 90 tolerance 10
#exit
Configuration: critical paging need to configure under paging-profile to allow the configured paging stages while skip the unconfigured paging stages.
configure
lte-policy
paging-profile paging_profile_name
[ no ] critical paging_stage
end
サンプル コンフィギュレーション
paging-profile paging-ps
paging-stage 1 match-criteria ue-contact-time 1200 action last-n-enb-last-tai max-n-enb 1 t3413-timeout 2 max-paging-attempts 1
paging-stage 2 match-criteria all action last-n-enb-last-tai max-n-enb 5 t3413-timeout 2 max-paging-attempts 1
paging-stage 3 match-criteria all action all-enb-last-tai t3413-timeout 2 max-paging-attempts 1
paging-stage 4 match-criteria all action all-enb-all-tai t3413-timeout 3 max-paging-attempts 1
critical 1 2
ここでは、重大なページングの条件が満たされた場合に、ページングステージ1および2がトリガーされます。ステージ1と2でページングの試行が失敗した場合、ページングロジックに従って、次のページングステージで試行がトリガーされます。このシナリオでは、ステージ3と4がページングされています。ただし、クリティカルページングが設定されている場合は、第2段階のページングの後に、それ以上のページングは試行されません。しかし、設定されていないページング段階でのページング試行も発生する例外的な状況があります。詳細については、「クリティカルページングの例外状態」のセクションを参照してください。
クリティカルページングの例外状態
前述したように、クリティカルページングの下に設定されたページングステージだけがトリガーされますが、これはトリガーされたステージとは異なり、この機能にはページングキャッシュの依存関係が存在します。そのため、特定のTAI-MMEマネージャマッピングがSessmgrページングキャッシュにすでに存在する場合、クリティカルページングでは、設定されたページング段階に対してのみページングトリガーが使用されます。ただし、特定のTAIで使用できるTAI-MMEMgrマッピングがない場合、ページング段階で設定されていなくても、後続のページング段階でも試行を確認できます。マッピングがページング・キャッシュの下に構築されると、再びクリティカル・ページングの通常のロジックが使用されます。
機能テスト

前述のように、ページングステージ1および2は、ページングプロファイルpaging-psの下で設定されます。したがって、ステージ1と2でページング障害が発生した場合、他のページングステージ3と4では他のページングテストがスキップされています。しかし、それでも、いくつかの試みが行われていることがわかります。また、「Critical Paging Exceptional condition」で定義されている条件が原因です。