簡介
本文描述如何檢測由於IP池刷新問題導致的基於RCM的UPF(使用者平面功能)升級故障。
疑難排解
1.如果活動冗餘配置管理器(RCM)控制器只有start_ip_pool_flush欄位,但缺少end_ip_pool_flush,則從活動冗餘配置管理器(RCM)控制器運行命令 rcm show-statistics switchover-verbose
,並查詢失敗的UPF切換詳細資訊。
[RCM-active] rcm# rcm show-statistics switchover-verbose
1月18日週四21:52:11.781 UTC+00:00
消息:
{
"stats_verbose": [
{
"status": "Failed",
"開始":"1月18日05:08:59.442",
"switchoverreason": "計畫的切換",
"switchoverfailreason":"Old Active由於接收待機狀態中的超時而從PendingStandby移動到Active(計畫的切換)",
"source_endpoint": "192.168.100.3",
"destination_endpoint": "192.168.100.2",
"start_chkpt_flush": "Jan 18 05:09:01.783",
"end_chkpt_flush_each": {
"1":"1月18日05:09:05.776",
「10」:「1月18日05:09:06.056」,
「11」:「1月18日05:09:05.909」,
「12」:「1月18日05:09:06.189」,
「13」:「1月18日05:09:05.991」,
「14」:「1月18日05:09:05.981」,
「15」:「1月18日05:09:05.531」,
「16」:「1月18日05:09:05.502」,
「17」:「1月18日05:09:05.751」,
「18」:「1月18日05:09:06.116」,
「19」:「1月18日05:09:05.834」,
"2":"1月18日05:09:05.932",
「20」:「1月18日05:09:05.889」,
「21」:「1月18日05:09:05.354」,
「22」:「1月18日05:09:05.780」,
"3":"1月18日05:09:05.671",
"4":"1月18日05:09:05.996",
"5":"1月18日05:09:05.455",
"6":"1月18日05:09:05.839",
「7」:「1月18日05:09:06.111」,
"8":"1月18日05:09:06.019",
"9":"1月18日05:09:05.996"
},
"end_chkpt_flush":"Jan 18 05:09:06.189",
"start_cfg_push": "Jan 18 05:08:59.495",
"end_cfg_push": "Jan 18 05:09:01.774",
"start_ip_pool_flush": "Jan 18 05:09:01.783" /*此行"end_ip_pool_flush"下缺少觀察*/
},
2.收集源和目標UPF系統日誌,覆蓋切換時間+/- 30分鐘。
3.深入研究目標端點UPF(輸出為192.168.100.2)syslog,並觀察UPF切換前後報告多個與IP池/資料塊相關的錯誤的vpnmgr6(上下文n6)。
日誌事件示例:
- 1月18日05:09:01 <UPF> evlogd: [local-60sec1.767] [srp 84220 error] [1/0/9589 <vpnmgr:6> vpnmgr_rcm.c:6235] [context: rcm, contextID: 6] [software internal system syslog] 安裝池路由失敗。留言已退回。
- evlogd: [local-60sec12.192] [vpn 5013錯誤] [1/0/9370 <vpnmgr:3> vpn_ip_pool.c:15699] [context: n6, contextID: 3] [software internal system syslog] #012Prefix <IPv4 address of the IP pool>未分配給此UP:找到的id3145764 start_addr: <IPv4 address> end_addr: <IP IP池的4地址>
注意:只有註冊的思科使用者才能訪問內部思科資訊和工具。
相關資訊