简介
本文档介绍如何在运行NX-OS版本9.3(9)的Cisco Nexus 3064PQ交换机上观察到指示TCAM资源耗尽的系统日志消息。
背景信息
耗尽发生在LPM_128 TCAM区域,负责存储前缀长度大于/64的IPv6路由。
观察到的系统日志消息
%IPFIB-2-FIB_TCAM_RESOURCE_EXPIRATION_LPM_128_IPV6:LPM-128表中用于IPV6路由的FIB TCAM已耗尽
%IPFIB-2-FIB_TCAM_RESOURCE_EXCEP_CLRD:已清除FIB TCAM资源使用率异常
%IPFIB-2-FIB_TCAM_RESOURCE_EXPIRATION_LPM_128_IPV6:LPM-128表中用于IPV6路由的FIB TCAM已耗尽
其他一致性检查消息
%UFDM-3-FIB_IPv6_ROUTE_CONSISTENCY_CHECKER_FAIL:插槽1上的FIB IPv6路由一致性检查失败
这些日志确认LPM_128表中IPv6路由的重复TCAM分配失败。
转发表架构 — Cisco Nexus 3000系列
|
表类型
|
前缀范围
|
描述
|
|
LPM表(IPv4)
|
/0到/31
|
存储除/32主机条目外的所有IPv4路由
|
|
LPM表(IPv6)
|
/0到/64
|
最多存储/64前缀的所有IPv6路由
|
|
LPM_128表(IPv6)
|
/65到/127
|
存储长度大于/64的IPv6路由
|
|
主机表
|
IPv4 /32、IPv6 /128
|
存储主机路由
|
系统输出 — IPv6路由摘要
命令
show system internal forwarding ipv6 route summary
输出摘要
- 最大LPM表条目数:15359
- LPM路由总数(<= /64):266
- LPM路由总数(> /64):157
根据此输出,157个路由正在利用LPM_128表,该表超出了平台容量。
LPM_128表利用率
LPM_128 TCAM区域存储从/65到/127的IPv6前缀。
在Nexus 3064PQ上,LPM_128的容量为:
- 启用uRPF后:64个条目
- 禁用uRPF后:128个条目
由于当前配置中禁用了uRPF,因此交换机最多可容纳128个IPv6 LPM_128条目。
当前使用157个条目超过此阈值,导致TCAM耗尽。
验证 — uRPF配置
命令
show running-config | i urpf
输出
system urpf disable
urpf disable
这确认禁用了uRPF,允许扩展LPM_128容量。
资源利用率摘要
- 已使用的IPv6 LPM_128条目:157
- 最大IPv6 LPM_128容量:128
一旦条目数量超过最大可用TCAM容量,系统就会触发此系统日志警报:
%IPFIB-2-FIB_TCAM_RESOURCE_EXPIRATION_LPM_128_IPV6:LPM-128表中用于IPV6路由的FIB TCAM已耗尽
根本原因分析
这是在Cisco Nexus 3064PQ平台上确认的TCAM资源耗尽案例,原因如下:
- 前缀长度大于/64的IPv6路由过多,超过了可用的LPM_128 TCAM区域容量。
- Nexus 3064PQ架构固有的硬件限制。
平台特定容量详细信息
|
配置
|
LPM_128表大小
|
LPM表大小(/0-/64)
|
|
uRPF已启用
|
64个条目
|
8192个条目
|
|
uRPF已禁用
|
128个条目
|
16384项
|
注意:这些限制特定于Nexus 3064PQ,并低于大多数其他Nexus 3000系列交换机,其中LPM_128表通常支持128个(启用uRPF)和256个(禁用uRPF)条目。
推荐的补救
- 路由概要
- 为/65和/127之间的前缀实施IPv6路由汇总,以减少LPM_128 TCAM区域中的条目。
- 检查路由策略
- 优化来自上游对等体的路由通告,以限制长前缀IPv6路由。
- 检验不必要的静态路由或重新分发的路由不会导致表耗尽。
- 硬件升级
- 如果汇总不可行,请考虑迁移到更高容量的Nexus平台(例如Nexus 9000系列)。
摘要
|
参数
|
观测值
|
平台限制
|
状态
|
|
IPv6 LPM_128路由
|
157
|
128(禁用uRPF)
|
超出
|
|
系统日志事件
|
%IPFIB-2-FIB_TCAM_RESOURCE_EXPIRATION_LPM_128_IPV6
|
不适用
|
已触发
|
|
根本原因
|
LPM_128中的TCAM资源耗尽
|
硬件限制
|
已确认
|
结论
由于IPv6路由超过LPM_128 TCAM容量,Nexus 3064PQ交换机经历了TCAM耗尽。
路由总结和优化是防止进一步发生路由故障的必要条件。