简介
本文档介绍如何检测由于IP池刷新问题导致的基于RCM的UPF(用户平面功能)升级故障。
故障排除
1.如果活动冗余配置管理器(RCM)控制器只有start_ip_pool_flush字段,但缺少end_ip_pool_flush,则从活动冗余配置管理器(RCM)控制器运行命令 rcm show-statistics switchover-verbose
,并查找失败的UPF切换详细信息。
[RCM-active] rcm# rcm show-statistics switchover-verbose
1月18日周四21:52:11.781 UTC+00:00
邮件:
{
"stats_verbose": [
{
"状态": "失败",
"开始":"1月18日05:08:59.442",
"切换原因":"计划的切换",
"switchoverfailreason":"由于接收备用状态超时(计划切换),旧主用从PendingStandby移动到Active",
"source_endpoint": "192.168.100.3",
"destination_endpoint": "192.168.100.2",
"start_chkpt_flush": "1月18日05:09:01.783",
"end_chkpt_flush_each": {
"1":"1月18日05:09:05.776",
"10":"1月18日05:09:06.056",
"11":"1月18日05:09:05.909",
“12”:“1月18日05:09:06.189”,
“13”:“1月18日05:09:05.991”,
“14”:“1月18日05:09:05.981”,
“15”:“1月18日05:09:05.531”,
“16”:“1月18日05:09:05.502”,
“17”:“1月18日05:09:05.751”,
“18”:“1月18日05:09:06.116”,
“19”:“1月18日05:09:05.834”,
"2":"1月18日05:09:05.932",
"20":"1月18日05:09:05.889",
"21":"1月18日05:09:05.354",
"22":"1月18日05:09:05.780",
"3":"1月18日05:09:05.671",
"4":"1月18日05:09:05.996",
"5":"1月18日05:09:05.455",
"6":"1月18日05:09:05.839",
"7":"1月18日05:09:06.111",
"8":"1月18日05:09:06.019",
“9”:“1月18日05:09:05.996”
},
"end_chkpt_flush": "1月18日05:09:06.189",
"start_cfg_push": "1月18日05:08:59.495",
"end_cfg_push": "1月18日05:09:01.774",
"start_ip_pool_flush": "Jan 18 05:09:01.783" /*此行"end_ip_pool_flush"下缺少观察结果*/
},
2.收集源和目标UPF系统日志,覆盖切换时间+/- 30分钟。
3.深入研究目标终端UPF(输出为192.168.100.2)系统日志和UPF切换前后的UPF系统日志,并观察vpnmgr6(情景n6)报告与IP池/数据块相关的多个错误。
日志事件示例:
- 1月18日05:09:01 <UPF> evlogd: [local-60sec1.767] [srp 84220 error] [1/0/9589 <vpnmgr:6> vpnmgr_rcm.c:6235] [context: rcm, contextID: 6] [software internal system syslog]安装池路由失败。邮件已退回。
- evlogd: [local-60sec12.192] [vpn 5013错误] [1/0/9370 <vpnmgr:3> vpn_ip_pool.c:15699] [context: n6, contextID: 3] [software internal system syslog] #012Prefix <IP池的IPv4地址> 未分配给此UP:找到的id 3145764 start_addr最近的块: <IPv4 address> end_addr: <IP IP池的4地址>
注意:只有思科注册用户才能访问思科内部信息和工具。
相关信息