IP : 简单网络管理协议 (SNMP)

监控ASR 1000系统利用率的SNMP对象标识符

2016 年 10 月 24 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 8 月 22 日) | 反馈

简介

本文描述(OIDs)将使用的推荐的对象标识符为了监控CPU和内存资源在Cisco ASR 1000系列模块化路由器。不同于基于软件的转发平台, 1000系列的ASR包括在其system:的这些功能元件

  • ASR 1000系列路由处理器(RP)
  • ASR 1000系列嵌入式服务处理器(ESP)
  • ASR 1000系列SPA接口处理器(SIP)

同样地,它由在导致每受管理设备将轮询的另外的OIDs的生产环境的这些处理器中的每一个要求监控CPU和存储器利用率。

贡献用Vishnu Asok, Cisco TAC工程师。

先决条件

要求

Cisco 建议您了解以下主题:

  • 简单网络管理协议 (SNMP)
  • Cisco IOS XE

使用的组件

本文档不限于特定的软件和硬件版本。

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

监控思科IOSd存储器利用率的SNMP OID

在ASR 1000,您需要使用设计的OIDs 64位体系结构平台为了监控内存使用:

处理器池空闲存储器1.3.6.1.4.1.9.9.221.1.1.1.1.20.7000.1(MIBcempMemPoolHCFree)
处理器池最大的内存1.3.6.1.4.1.9.9.221.1.1.1.1.22.7000.1(MIBcempMemPoolHCLargestFree)
处理器池占用的内存1.3.6.1.4.1.9.9.221.1.1.1.1.18.7000.1(MIBcempMemPoolHCUsed)
处理器池低内存1.3.6.1.4.1.9.9.221.1.1.1.1.24.7000.1(MIBcempMemPoolHCLowestFree)

注意:如果使用较少特定OID为了轮询思科IOSd内存统计信息,系统产生两输出-思科IOSd空闲存储器(OID-7000.1)和Linux共享内存平底船接口(LSMPI)内存(OID-7000.2)。这也许造成管理站报告LSMPI池的一低内存警报。LSMPI内存池用于为了传输从转发处理器的数据包到路由处理器。在ASR 1000平台上, lsmpi_io池有是正常的一点空闲存储器-通常少于1000个字节。思科建议您由网络管理应用程序禁用LSMPI池的监听为了避免假告警。

监控思科IOSd CPU利用率的SNMP OID

Cisco IOSd实例的CPU利用率(如察觉由输出show process cpu命令)可以轮询与OID "1.3.6.1.4.1.9.2.1.56"。

示例如下所示:

此输出显示OID "1.3.6.1.4.1.9.2.1.56"的投票返回思科IOSd线索的瞬时CPU利用率。

ASR1K#show process cpu
CPU utilization for five seconds: 63%/0%; one minute: 6%; five minutes: 2%
PID     Runtime(ms)    Invoked    uSecs     5Sec    1Min   5Min   TTY  Process
  1         3             21       142     0.00%   0.00%  0.00%   0   Chunk Manager


user@server% snmpwalk -v2c -c poll 10.10.10.1 1.3.6.1.4.1.9.2.1.56
SNMPv2-SMI::enterprises.9.2.1.56.0 = INTEGER: 63

同样OID可以用于一份嵌入式活动管理器(EEM)脚本为了排除故障断断续续CPU峰值。这是一次触发在75%上的思科IOSd CPU峰值的示例脚本。

event manager applet ASR_High_CPU
event snmp oid 1.3.6.1.4.1.9.2.1.56 get-type next entry-op ge entry-val 75
exit-time 30 poll-interval 1
action 1.0 syslog msg "High cpu detected. Please check bootflash:cpuinfo.txt"
action 2.0 cli command "enable"
action 3.0 cli command "term exec prompt timestamp"
action 4.0 cli command "show processes cpu sorted | append bootflash:cpuinfo.txt"
action 5.0 cli command "show interfaces | append bootflash:cpuinfo.txt"
action 6.0 cli command "show users | append bootflash:cpuinfo.txt"
action 7.0 cli command "show debugs | append bootflash:cpuinfo.txt"
action 8.0 cli command "end"

监控RP/ESP/SIP CPU利用率的SNMP OID

ASR1K#show platform software status control-processor brief | section Load
Load Average
Slot      Status        1-Min   5-Min      15-Min
RP0      Healthy        0.75    0.47        0.41
ESP0     Healthy        0.00    0.00        0.00
SIP0     Healthy        0.00    0.00        0.00

它对应对:

1.3.6.1.4.1.9.9.109.1.1.1.1.24.2 = Gauge32: 75  -- 1 min RP0
1.3.6.1.4.1.9.9.109.1.1.1.1.24.3 = Gauge32: 0  -- 1 min ESP0
1.3.6.1.4.1.9.9.109.1.1.1.1.24.4 = Gauge32: 0  -- 1 min SIP0
1.3.6.1.4.1.9.9.109.1.1.1.1.25.2 = Gauge32: 47  -- 5 min RP0
1.3.6.1.4.1.9.9.109.1.1.1.1.25.3 = Gauge32: 0   -- 5 min ESP0
1.3.6.1.4.1.9.9.109.1.1.1.1.25.4 = Gauge32: 0  -- 5 min SIP0
1.3.6.1.4.1.9.9.109.1.1.1.1.26.2 = Gauge32: 41  -- 15 min RP0
1.3.6.1.4.1.9.9.109.1.1.1.1.26.3 = Gauge32: 0  -- 15 min ESP0
1.3.6.1.4.1.9.9.109.1.1.1.1.26.4 = Gauge32: 0   -- 15 min SIP0

参考监控ASR内核与说明如何使用上述OIDs为了监控ASR 1000内核负载CPU的EEM脚本的负载CPU

注意:RP2包含两物理CPU,但是CPU没有分开监控。CPU利用率是CPU聚集结果并且cpmCPUTotalTable对象只包含RP CPU的一个条目。这也许偶尔地造成管理站报告在100%上的CPU利用率。

监控RP/ESP/SIP存储器利用率的SNMP OID

这些输出列出OIDs轮询显示平台软件状态控制处理器摘要命令察觉的每个处理器各自的内存统计信息。

ASR1K#show platform software status control-processor brief | s Memory
Memory (kB)
Slot   Status   Total         Used(Pct)          Free (Pct)          Committed (Pct)
RP0    Healthy   3874504       2188404 (56%)      1686100 (44%)       2155996 (56%)
ESP0   Healthy    969088       590880 (61%)       378208 (39%)       363840 (38%)
SIP0   Healthy    471832       295292 (63%)       176540 (37%)       288540 (61%)
(cpmCPUMemoryHCUsed)
1.3.6.1.4.1.9.9.109.1.1.1.1.17.2 = Counter64: 590880 -ESP Used memory
1.3.6.1.4.1.9.9.109.1.1.1.1.17.3 = Counter64: 2188404 -RP used memory
1.3.6.1.4.1.9.9.109.1.1.1.1.17.4 = Counter64: 295292 -SIP used memory
(cpmCPUMemoryHCFree)
1.3.6.1.4.1.9.9.109.1.1.1.1.19.2 = Counter64: 378208 -ESP free Memory
1.3.6.1.4.1.9.9.109.1.1.1.1.19.3 = Counter64: 1686100 -RP free Memory
1.3.6.1.4.1.9.9.109.1.1.1.1.19.4 = Counter64: 176540 -SIP free memory
cpmCPUMemoryHCCommitted)
1.3.6.1.4.1.9.9.109.1.1.1.1.29.2 = Counter64: 363840 -ESP Committed Memory
1.3.6.1.4.1.9.9.109.1.1.1.1.29.3 = Counter64: 2155996 -RP Committed Memory
1.3.6.1.4.1.9.9.109.1.1.1.1.29.4 = Counter64: 288540 -SIP committed memory

注意:上一个OIDs产生一只独立输出集成1RU (机架部件)平台的例如ASR 1001和ADR 1002-X。在ASR 1001的控制CPU有三个逻辑函数- RP、FP (转发处理器)和CC (载波卡)。在ASR的1002不同的板间通常将被传播的所有功能在ASR 1001的同样CPU运行。

Enable (event) CoPP为了从SNMP Overpolling保护

控制平面策略(CoPP)提供更加好的平台可靠性和可用性的配置在服务拒绝(DoS)攻击情形下。CoPP功能对待控制层面作为一个分开的实体与其入口和出口流量的自己的接口。此接口呼叫平底船/注入接口。CoPP策略的部署在一被逐步采用的方法需要完成。初期阶段应该在一宽宏状态修正数据包为了允许在测试和初期迁移/部署阶段的分析。一旦部署,应该检查其中每一类关联与CoPP策略,并且速率调节。一典型的示例如何使CoPP为了保护控制层面以防止overpolling显示此处:

class-map match-all SNMP
match access-group name SNMP
!

!
ip access-list extended SNMP
permit udp any any eq snmp

!
policy-map CONTROL-PLANE-POLICY
description CoPP for snmp
class SNMP
police rate 10 pps burst 10 packets
conform-action transmit
exceed-action drop
!

激活策略映射如指示此处:

ASR1K(config)#control-plane
ASR1K(config-cp)#service-policy input CONTROL-PLANE-POLICY
ASR1K(config-cp)#end


Document ID: 118901