简介

    本文档介绍连接故障管理(CFM)技术、配置、后检查和故障排除。并介绍 CFM 的基本概念、CFM 的构成要素、配置指南、show 命令和对 CFM 消息的 Wireshark 分析。本文档不涉及为确保 CFM 正常工作所需遵守的硬件限制或支持的接口。

    先决条件

    要求

    Cisco 建议您了解以下主题:

    • 以太网技术
    • 以太网虚拟连接 (EVC)

    使用的组件

    本文档不限于特定的软件和硬件版本。

    本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。

    背景信息

    以太网 CFM 是端到端每服务实例以太网层运行、维护和管理 (OAM) 协议。它包括大型以太城域网 (MAN) 和广域网 (WAN) 的主动连接监控、故障验证和故障隔离。

    以太网作为 MAN 和 WAN 技术问世对以太网的传统运营(仅集中在企业网络上)提出了一系列新的 OAM 要求。以太网技术已扩展到运营商领域,无论是规模、复杂性还是用户范围,企业网络都无法与运营商网络相提并论,这就使链路正常运行时间的运营管理变得至关重要。更重要的是,要想保证日常运营正常进行,必须及时隔离故障并做出响应,因此 OAM 可直接转化为运营商的竞争力。

    Carrier ethernet services chart

    以太网 OAM

    • 构成要素 - IEEE 802.1ag
    • CFM - IEEE 802.3ah(第 57 条)
    • 以太网链路 OAM(也称为 802.3 OAM、链路 OAM 或第一英里以太网 [EFM] OAM)- ITU-T Y.1731
    • 适用于基于以太网的网络的 OAM 功能和机制 - MEF E-LMI(以太网本地管理接口)

    以太网 OAM 协议位置

    Ethernet OAM protocols position

    • E-LMI - 用户网络接口 (UNI)
    • 链路 OAM - 任何点对点 802.3 链路
    • CFM — 端到端UNI到UNI
    • MPLS OAM - MPLS 云中

    CFM 概述

    • 该系列协议提供用于检测、验证、隔离和报告端到端以太网连接故障的功能
    • 采用随客户流量在带内传输的常规以太网帧
    • 无法解释 CFM 消息的设备将其作为正常的数据帧转发
    • CFM帧按以太网类型(0x8902)和dMAC地址(用于组播消息)进行区分
    • 2007年IEEE标准中由IEEE标准化。802.1ag-2007

    关键 CFM 机制

    • 嵌套的维护域 (MD),用于终止对给定端到端服务进行网络管理
    • 维护集 (MA),用于监控给定 MD 下的服务实例
    • 维护点 (MP),用于生成并响应 CFM 协议数据单元 (PDU)
    • 各种协议(连续性检查、环回和链路跟踪),用于故障管理活动

    CFM 概念

    维护域

    Maintenance domain

    • 按运营/合同边界来定义,例如客户/服务提供商/运营商
    • MD可以嵌套和触摸,但从不交叉
    • 最多可“嵌套”八级:MD 级别(0 到 7)- 级别越高,范围越广
    • MD 名称格式:null、MAC 地址、DNS 或基于字符串

    维护集

    Maintenance association

    • 监控给定 MD 中特定服务实例的连接,例如流经四个 MD 的一项服务 = 四个 MA
    • 以位于域边缘的一组维护终端 (MEP) 来定义
    • 以 MAID 标识 -“短 MA”名称 + MD 名称
    • 短 MA 名称格式 - Vlan ID、VPN-ID、整数或基于字符串

    维护点 - 维护终端

    Maintenance end point

    • 维护集终端
    • 定义 MD 的边界
    • 支持检测 MA 中任何一对 MEP 之间的连接故障
    • 按每个 MA 关联并以 MEPID (1-8191) 标识
    • 可以发起和响应 CFM PDU

    维护域中间点

    Maintenance domain intermediate point

    • 维护域中间点 (MIP)
    • 支持发现 MEP 之间的路径和这些路径沿途的故障位置
    • 可以按每个 MD 和 VLAN/EVC 进行关联(手动或自动创建)
    • 可以添加、检查和响应收到的 CFM PDU

    UP MEP

    UP MEP

    • MEP 生成的 CFM PDU 将被发送到网桥的中继功能,而非通过连接到端口(已配置 MEP)的线路发送
    • 要由 MEP 响应的 CFM PDU 应该是通过网桥的中继功能到达的 CFM PDU
    • 适用于交换机

    UP MEP - 帧转发

    Frame forwarding

    Up MEP - Frame Fowarding

    DOWN MEP

    Down Mep

    • MEP 生成的 CFM PDU 将通过连接到端口(已配置 MEP)的线路发送
    • 要由 MEP 响应的 CFM PDU 应该是通过连接到端口(已配置 MEP)的线路到达的 CFM PDU
    • 端口 MEP - 使用级别为零 (0) 的特殊 Down MEP 检测链路级(而非服务)故障
    • 适用于路由器和交换机

    DOWN MEP - 帧转发

    Frame forwarding

    Down MEP - frame fowarding

    MP 在网桥端口中的位置

    MP placement in a bridge port

    MA 和 UP/DOWN MEP

    MAs and UP/DOWN MEPs

    UP/DOWN EP 在交换机中的适用性

    • DOWN MEP 通常用于跨一条链路的 MA
    • UP MEP 通常用于范围更广的 MA,例如端到端和超出一条链路的范围

    故障管理

    CFM 协议

    CFM 定义了三 (3) 个协议:

    1. 连续性检查协议
      • 故障检测
      • 故障通知
      • 故障恢复
    2. 环回协议
      • 故障验证
    3. 链路跟踪协议
      • 路径发现和故障隔离

    连续性检查协议

    • 用于故障检测、通知和恢复
    • 每维护关联 multicast "heart-beat" 消息由MEP(3.3毫秒、10毫秒、100毫秒、1秒、10秒、1分钟、10分钟)以可配置的周期间隔传输 — 单向(无需响应)
    • 配置了 MEP 的端口的运营商状态
    • 由 MIP 在同一 MD 级别编目,以同一 MA 中的远程 MEP 终止

    环回协议

    • 用于故障验证 — Ethernet Ping
    • MEP 可将单播 LBM 传输到同一 MA 中的 MEP 或 MIP
    • MEP 也可以传输组播 LBM(由 ITU-T Y.1731 定义),在此情况下仅同一 MA 中的 MEP 会响应
    • 接收MP响应并将LBM转换为单播LBR,发回原始MEP

    链路跟踪协议

    • 用于路径发现和故障隔离 — Ethernet Traceroute
    • MEP 可以传输组播消息 (LTM),以便发现 MP 和通往同一 MA 中 MIP 或 MEP 的路径
    • 沿路径的每个MIP和终止MP将单播LTR返回原始MEP

    要将三种协议全部整合到一起并在网络中实施,请完成以下步骤:

    1. 运行连接检查,以便主动检测软件或硬件故障。
    2. 检测到故障时,使用环回、CCM 数据库和错误数据库对其进行验证。
    3. 验证后,运行 traceroute 将其隔离。还可以使用多段 LBM 来隔离故障。
    4. 如果隔离的故障指向虚电路,则可以使用该技术的 OAM 工具进一步隔离故障;以 MPLS PW 为例,就可以使用 VCCV 和 MPLS ping。

    实施案例

    Implementation cases - Ethernet L2 VPN

    Implementation cases - L3 VPN with Ethernet Access (CE-PE)

    配置管理 (UP MEP)

    拓扑

    UP MEP topology

    为了探索配置,我们创建了一个小型拓扑来进行演示。“域”、“服务名称”和“EVC 名称”所使用的名称如下所示:


    Domain: ISPdomain
    Domain level: 5
    Service Name: XCONN_EVC
    EVC Name: EVC_CE1

    PE1:

    ---------------------------Enabling CFM globally-------------------------------------
    ethernet cfm ieee
    ethernet cfm distribution enable
    ethernet cfm global
    ethernet cfm traceroute cache
    ethernet cfm alarm notification all
    ethernet cfm domain ISPdomain level 5
     service XCONN_EVC evc EVC_CE1
      continuity-check

    ---------------------------Enabling CFM MEP under EVC----------------------------

    int gig4/2
    service instance 2100 ethernet EVC_CE1
      encapsulation dot1q 2100
      xconnect 192.168.3.3 2100 encapsulation mpls
      cfm mep domain ISPdomain mpid 102
       monitor loss counter

    PE3:

    ---------------------------Enabling CFM globally-------------------------------------

    ethernet cfm ieee
    ethernet cfm distribution enable
    ethernet cfm global
    ethernet cfm traceroute cache
    ethernet cfm alarm notification all
    ethernet cfm domain ISPdomain level 5
     service XCONN_EVC evc EVC_CE1
      continuity-check

    ---------------------------Enabling CFM MEP under EVC----------------------------

    int gig4/2
    service instance 2100 ethernet EVC_CE1
      encapsulation dot1q 2100
      xconnect 192.168.1.1 2100 encapsulation mpls
      cfm mep domain ISPdomain mpid 201
       monitor loss counter

    验证

    显示命令

    PE1#show ethernet cfm maintenance-points local
    Local MEPs:
    --------------------------------------------------------------------------------
    MPID Domain Name                                 Lvl   MacAddress     Type  CC
    Ofld Domain Id                                   Dir   Port           Id
         MA Name                                           SrvcInst       Source
         EVC name
    --------------------------------------------------------------------------------
    102  ISPdomain                                   5     ccef.48d0.64b0 XCON  Y
    No   ISPdomain                                   Up    Gi4/2          N/A
         XCONN_EVC                                         2100           Static
         EVC_CE1

    Total Local MEPs: 1

    PE1#show ethernet cfm maintenance-points remote
    --------------------------------------------------------------------------------
    MPID  Domain Name                                 MacAddress          IfSt  PtSt
    Lvl  Domain ID                                   Ingress
     RDI  MA Name                                     Type Id             SrvcInst
          EVC Name                                                        Age
          Local MEP Info
    --------------------------------------------------------------------------------
    201   ISPdomain                                   8843.e1df.00b0      Up    Up
    5    ISPdomain                                   Gi4/2:(192.168.3.3, 2100)
     -    XCONN_EVC                                   XCON N/A            2100
          EVC_CE1                                                         5s
          MPID: 102 Domain: ISPdomain MA: XCONN_EVC

    在此输出中,你可以看到远程 mpid 和远程 MAC 地址。CFM 状态显示为 up/up。

    验证连续性检查

    PE1#ping ethernet mpid 201 domain ISPdomain service XCONN_EVC
    Type escape sequence to abort.
    Sending 5 Ethernet CFM loopback messages to 8843.e1df.00b0, timeout is 5 seconds:!!!!!
    Success rate is 100 percent (5/5), round-trip min/avg/max = 4/4/4 ms

    PE1#traceroute ethernet mpid 201 domain ISPdomain service XCON$
    Type escape sequence to abort. TTL 64. Linktrace Timeout is 5 seconds
    Tracing the route to 8843.e1df.00b0 on Domain ISPdomain, Level 5,
    service XCONN_EVC, evc EVC_CE1
    Traceroute sent via Gi4/2:(192.168.3.3, 2100), path found via MPDB

    B = Intermediary Bridge
    ! = Target Destination
    * = Per hop Timeout
    --------------------------------------------------------------------------------
                                 MAC      Ingress        Ingr Action  Relay Action
      Hops   Host             Forwarded   Egress         Egr Action   Previous Hop
    --------------------------------------------------------------------------------
    B 1                    ccef.48d0.64b0 Gi4/2          IngOk        RlyMPDB
                           Forwarded
    ! 2                    8843.e1df.00b0                             RlyHit:MEP
                           Not Forwarded                              ccef.48d0.64b0

    嗅探器结果

    在 PE1 上放置嗅探器设备,捕获来自远程位置的所有 CFM 数据包。示例如下所示:

    Up MEP sniffer results

    在该屏幕截图中:

    • 序号 2 和 13 所示为一般连续性检查消息 (CCM)。
    • 序号 4、5、6、7 和 8 所示为因 ping 测试而生成的环回应答 (LBR)。
    • 序号 10 所示为因 traceroute 测试而生成的线路跟踪应答 (LTR)。

    配置管理 (DOWN MEP)

    在上一个示例中,CE1可以使用EVC,该CE1位于PE1和PE3后面。您可以在CE1设备上启用关闭MEP,但MD级别更高。此示例中的 MD 级别为 7。

    Domain: CEdomain
    Domain level: 7

    DOWN MEP topology

    CE1_A
    --------------------Enabling CFM globally---------------------------

    ethernet cfm ieee
    ethernet cfm global
    ethernet cfm domain CEdomain level 7
     service CUST vlan 2100 direction down (down Mep)
      continuity-check


    ------------------Enabling CFM MEP under interface--------------------

    interface GigabitEthernet1/0/1
     switchport access vlan 2100
     switchport trunk encapsulation dot1q
     switchport mode trunk
     ethernet cfm mep domain CEdomain mpid 1002 service CUST


    CE1_B
    --------------------Enabling CFM globally---------------------------

    ethernet cfm ieee
    ethernet cfm global
    ethernet cfm domain CEdomain level 7
     service CUST vlan 2100 direction down
      continuity-check

    ------------------Enabling CFM MEP under interface--------------------

    interface GigabitEthernet1/0/1
     switchport access vlan 2100
     switchport trunk encapsulation dot1q
     switchport mode trunk
     ethernet cfm mep domain CEdomain mpid 2001 service CUST

    验证

    显示命令

    CE1#show ethernet cfm maintenance-points remote
    --------------------------------------------------------------------------------
    MPID  Domain Name                                 MacAddress          IfSt  PtSt
     Lvl  Domain ID                                   Ingress
     RDI  MA Name                                     Type Id             SrvcInst
          EVC Name                                                        Age
          Local MEP Info
    --------------------------------------------------------------------------------
    2001  CEdomain                                    5835.d970.9381      Up    Up
     7    CEdomain                                    Gi1/0/1
     -    CUST                                        Vlan 2100           N/A
          N/A                                                             3s
         MPID: 1002 Domain: CEdomain MA: CUST

    Total Remote MEPs: 1
    CE1#show ethernet cfm maintenance-points local
    Local MEPs:
    --------------------------------------------------------------------------------
    MPID Domain Name                                 Lvl   MacAddress     Type  CC
    Ofld Domain Id                                   Dir   Port           Id
         MA Name                                           SrvcInst       Source
         EVC name
    --------------------------------------------------------------------------------
    1002 CEdomain                                    7     0023.eac6.8d01 Vlan  Y
    No   CEdomain                                    Down  Gi1/0/1        2100
         CUST                                              N/A            Static
         N/A

    验证连续性检查

    CE1#ping ethernet mpid 2001 domain CEdomain service CUST

    Type escape sequence to abort.
    Sending 5 Ethernet CFM loopback messages to 5835.d970.9381, timeout is 5 seconds:!!!!!
    Success rate is 100 percent (5/5), round-trip min/avg/max = 1/1/1 ms

    Total Local MEPs: 1
    Till now MIP is not configured on PE1 and PE3 hence output of show command and
    traceroute command will be as per below.

    CE1#tracer ethernet mpid 2001 domain CEdomain service CUST
    Type escape sequence to abort. TTL 64. Linktrace Timeout is 5 seconds
    Tracing the route to 5835.d970.9381 on Domain CEdomain, Level 7, vlan 2100
    Traceroute sent via Gi1/0/1

    B = Intermediary Bridge
    ! = Target Destination
    * = Per hop Timeout
    --------------------------------------------------------------------------------
                                 MAC      Ingress        Ingr Action  Relay Action
      Hops   Host             Forwarded   Egress         Egr Action   Previous Hop
    --------------------------------------------------------------------------------
    ! 1                    5835.d970.9381 Gi1/0/1        IngOk        RlyHit:MEP
                           Not Forwarded                              0023.eac6.8d01

    CE1_A 可以通过 traceroute 看到 CE1_B。

    现在,请在 PE1 和 PE2 上配置 MIP。

    PE1:
    interface GigabitEthernet 4/2
     service instance 2100 ethernet EVC_CE1
     cfm mip level 7

    PE2:
    interface GigabitEthernet 4/2
     service instance 2100 ethernet EVC_CE1
     cfm mip level 7

    现在,请在 CE1 上检查 traceroute 结果。

    CE1#traceroute ethernet mpid 2001 domain CEdomain service CUST
    Type escape sequence to abort. TTL 64. Linktrace Timeout is 5 seconds
    Tracing the route to 5835.d970.9381 on Domain CEdomain, Level 7, vlan 2100
    Traceroute sent via Gi1/0/1

    B = Intermediary Bridge
    ! = Target Destination
    * = Per hop Timeout

    --------------------------------------------------------------------------------
                                 MAC      Ingress        Ingr Action  Relay Action
      Hops   Host             Forwarded   Egress         Egr Action   Previous Hop
    --------------------------------------------------------------------------------
    B 1                    ccef.48d0.64b0 Gi4/2          IngOk        RlyMPDB
                           Forwarded                                  0023.eac6.8d01
    B 2                    8843.e1df.00b0                             RlyMPDB
                           Forwarded      Gi4/2          EgrOK        ccef.48d0.64b0
    ! 3                    5835.d970.9381 Gi1/0/1        IngOk        RlyHit:MEP
                           Not Forwarded                              8843.e1df.00b0

    您可以看到traceroute输出中的差异。配置PE1和PE2上的MIP后,会看到中间跳。

    调试命令

    debug ethernet cfm diagnostic packets
    debug ethernet cfm packets

    性能管理

    关键性能指标 (KPI)

    • 帧丢失率 - 在时间间隔 T 内,未送达的服务帧占传递的服务帧总数的百分比 (%)
    • 帧延迟 - 服务帧的往返/单向延迟
    • 帧延迟差异 - 一对服务帧之间的帧延迟差异

    测量 KPI

    帧延迟/延迟差异

    • 单向或双向测量
    • 需要带有时间戳的合成流量
    • 需要对单向延迟进行每日定时同步

    帧丢失

    • 单向帧丢失
      • 源到目的 - 远端
      • 目的到源 - 近端
    • 服务帧丢失(实际丢失)- 需要交换计数器
      • 仅适用于点对点 EVC
    • 统计帧丢失 - 依赖合成流量
    • 多点服务需要合成流量
      • 适用于点对点和多点 EVC

    思科性能管理解决方案

    • 基于 IEEE 802.1ag 和供应商特定 PDU 的以太网性能探测
      • 测量单向 FD/FDV/FL 和双向 FD/FDV
      • 部分支持多供应商网络
      • 通过 IP SLA 进行配置和计划
      • 以功能名称发货: IP SLA for Metro Ethernet
    • 基于 Y.1731 PDU 的以太网性能探测
    • 在Cisco IOS®中,以下机制的优先级:单向 ETH-DM/双向 ETH-DM、单端 ETH-LM 和思科提议的 Y.1731 扩展 (ETH-SLM) 多供应商互通性
    • 通过 IP SLA 配置并计划在软件和硬件辅助下的实施
    • 对选定的思科 IOS 和思科 IOS XR 平台逐步停止交付

    使用准则和限制

    • 思科 7600 实施
      • 以下 CFM 场景不支持 Y.1731 PM:
        • 交换机端口上的 MEP
        • VPLS L2VFI 上的 MEP
        • 与网桥域间的服务实例上的 UP MEP
        • 与网桥域间的未标记服务实例上的 DOWN MEP
        • 双重标记的路由(子)接口上的 MEP
        • 端口 MEP
          • 管理引擎切换后,将清除 Y.1731 PM 状态
        • 需要重新启动 IPSLA
          • 端口通道注意事项
        • 成员接口必须位于 ES+ 线卡上
        • 对丢失探测 (LMM) 而言,所有成员必须位于同一个 NPU 上(此限制不适用于延迟探测)
        • 添加/删除成员链接时,会话将变为无效
        • 在采用手动 EVC 负载均衡的端口通道上不支持 Y.1731 PM
        • 在 mLACP 上不支持 Y.1731 PM

    先决条件

    • 配置 CFM。
      • MD、MA 和 MEP
    • 将本地 MEP 配置分发到 ES+ 线卡。
      • 将硬件编程为响应传入的延迟测量消息 (DMM)/丢失测量消息 (LMM) PDU
      • Router(config)#ethernet cfm distribution enable
    • (可选)配置时间源协议(NTP 或 PTPv2)。 对单向延迟测量必须配置。
    • 启用向下同步到线卡。
      • Router(config)#platform time-source
    • (可选)在 CFM MEP 下启用服务帧每服务类别/合计计数器监控。对丢失探测必须配置。
      • Router(config-if-srv-ecfm-mep)#monitor loss counter

    配置管理

    前面的命令已在故障管理中启用,因此只需启用 IP SLA 即可开始性能管理。

    Ip sla 10
     Ethernet y1731 loss LMM domain SPdomain evc EVC_CE1 mpid 201 cos 8 source mpid 102
      Frame interval 100
      Aggregate interval 180

    Ip sla schedule 10 start-time after 00:00:30 life forever.

    验证

    PE1#show ip sla stat 10
    IPSLAs Latest Operation Statistics

    IPSLA operation id: 10
    Loss Statistics for Y1731 Operation 10
    Type of operation: Y1731 Loss Measurement
    Latest operation start time: 09:30:11.332 UTC Fri Dec 20 2013
    Latest operation return code: OK
    Distribution Statistics:

    Interval
     Start time:  09:30:11.332 UTC Fri Dec 20 2013
     Elapsed time: 56 seconds 
     Number of measurements initiated: 120
     Number of measurements completed: 120
     Flag: OK


    PE1#show ethernet cfm pm session active
    Display of Active Session
    ----------------------------------------------------------------------------
    EPM-ID   SLA-ID    Lvl/Type/ID/Cos/Dir Src-Mac-address Dst-Mac-address
    ----------------------------------------------------------------------------
     0       10        5/XCON/N/A/7/Up     ccef.48d0.64b0  8843.e1df.00b0
    Total number of Active Session: 1

    --> Src-Mac-address: SRC MAC of MEP,check 'show ethernet cfm maintenance-points local'
    --> Dst-Mac-address: MAC of dest MEP,check 'show ethernet cfm maintenance-points remote'

    PE1#show ethernet cfm pm session detail 0
    Session ID: 0
    Sla Session ID: 10
    Level: 5
    Service Type: XCO
    Service Id: N/A
    Direction: Up
    Source Mac: ccef.48d0.64b0
    Destination Mac: 8843.e1df.00b0
    Session Status: Active
    MPID: 102
    Tx active: yes
    Rx active: yes
    Timeout timer: stopped
    Last clearing of counters: 08:54:20.079 UTC Sat Dec 20 2013
    DMMs:
    Transmitted: 0
    DMRs:
    Rcvd: 0
    1DMs:
    Transmitted: 0
    Rcvd: 0
    LMMs:
    Transmitted: 3143161
    LMRs
    Rcvd: 515720
    VSMs:   Transmitted: 0
    VSRs:   Rcvd: 0

    调试命令

    debug ip sla trace <oper_id>
    debug ip sla error <oper_id

    相关信息