局域网交换 : VLAN 中继协议 (VLAN/VTP)

在园区网交换机网络中VLAN内部和VLAN间连通性缓慢的常见原因

2016 年 10 月 24 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 10 月 7 日) | 反馈


目录


简介

本文讨论可能造成网络缓慢。ï ¿  ½本文分类常见网络缓慢症状和概述途径对问题诊断和解决方法的多数commonï ¿  ½问题。

先决条件

要求

本文档没有任何特定的要求。

使用的组件

本文档不限于特定的软件和硬件版本。

规则

有关文档规则的详细信息,请参阅 Cisco 技术提示规则

缓慢的VLAN内部和在VLAN中间连接的常见原因

缓慢的连接症状在VLAN的可以由在不同的网络层的多个要素导致。通常网络速度问题也许在较低层次发生,但是症状在高水平可以被观察,当问题屏蔽自己在期限“慢VLAN”下。要澄清,本文定义了以下新建的期限:“缓慢的冲突域”, “缓慢的广播域” (换句话说,慢VLAN)和“缓慢的在VLAN中间的转发”。这些在原因第三部分类别定义,下面。

在下列场景(说明在下面的网络图中),有在服务器和客户端VLAN之间的一第3层(L3)交换机执行的InterVLAN路由。在此故障情景中,一个服务器连接到交换机,并且端口双工双重方式是在服务器端和全双工的配置的半双工在转换面。此误配置导致包丢失和缓慢,与增加的包丢失,当流量速率在服务器连接的链路时发生。对于用此服务器通信,问题看起来缓慢的在VLAN中间的转发的客户端,因为没有一问题通信对其它设备或客户端的他们同样VLAN的。问题发生,只有当通信对在不同的VLAN时的服务器。因此,在一个冲突域发生的问题,但是被看到作为缓慢的在VLAN中间的转发。

slow_int_vlan_connect-1.gif

原因三个类别

缓慢的原因可以分开成三个类别,如下:

缓慢的冲突域连接

冲突域定义作为在半双工端口配置,彼此连接或集线器配置的连接的设备。如果设备连接到交换机端口,并且全双工模式配置,这样点对点连接无碰撞的。在这样分段的缓慢能因不同的原因仍然发生。

缓慢的广播域连接(慢VLAN)

缓慢的广播域连接发生,当整个VLAN (即在同样VLAN的所有设备)体验缓慢。

缓慢的在VLAN中间连接(在VLAN之间的缓慢的转发)

缓慢的在VLAN中间连接(在VLAN之间的缓慢的转发)发生,当没有在本地VLAN的缓慢,但是流量需要转发到备选VLAN,并且没有转发以期望速率。

网络缓慢的原因

包丢失

在大多数情况下,网络被认为慢,当更高层协议(应用程序)时需要延长的时刻完成典型地运行更加快速的操作。该缓慢由一些数据包损耗在网络的造成,导致高层协议类似TCP或应用程序计时和启动重新传输。

硬件转发问题

当另外一种缓慢,造成的是由网络设备,转发(是否Layer2 [L2]或L3)迟缓地执行。这归结于从正常(设计的)操作和交换的偏差减慢路径转发。此的示例是,当多层交换在switchï ¿  ½转发L3在VLAN之间的数据包在硬件里时,但是由于误配置, MLS不正常运行,并且转发由路由器在里完成极大下降在VLAN中间的转发速率)的软件(。

排除故障原因

排除故障冲突域问题

因此,如果您的VLAN看来慢,首先请隔离冲突域问题。您需要设立同一冲突域的只有用户是否遇到连接问题,或者是否在多个域发生。要执行此,请做在用户PCs之间的数据传输在同一冲突域,并且比较此性能与另一冲突域性能,或者与其期望性能。

如果问题在该冲突域只发生,并且其他冲突域性能在同样VLAN的是正常,则看看在确定什么的交换机的端口计数器麻烦此分段可能体验。很可能,原因是简单,例如双工不匹配。别的,较少frequentï ¿  ½原因是一被超载的或过度预定的分段。关于排除故障单个分段问题的更多信息,参考配置和排除故障以太网10/100/1000Mb半/全双工自动协商的本文。

如果不同的冲突域的用户(但是在同样VLAN)有同样性能问题,可能由在一个或更多以太网段的双工不匹配仍然造成在源和目的之间。下列场景经常发生:交换机手工配置有在所有端口的全双工VLAN的(默认设置是“自动”),而用户(网络接口界面卡[NICs])连接对端口执行自动协商过程。这导致在所有端口,并且,因此,坏性能的双工不匹配在每个端口(冲突域)。因此,虽然看起来,好象整个VLAN (广播域)有性能问题,它仍然分类作为双工不匹配,每个端口冲突域的。

将考虑的另一个案件是特定NIC性能问题。如果与性能问题的NIC连接对共享段,则可能看来一全部的分段体验缓慢,特别是如果NIC属于也服务其他分段或VLAN的服务器。请记住此案件,因为可能误导您,当您排除故障。再次,缩小此问题的最佳方法是执行在两台主机之间的数据传输在同一分段(其中与推测的问题的NIC连接),或者,如果仅NIC在该端口,隔离不是容易,因此请尝试在此连接在一个分开的端口的主机或者尝试的不同的NIC怀疑的主机,保证端口和NIC的正确的配置。

如果问题仍然存在,请尝试排除故障交换机端口。参考本文故障排除交换机端口和接口问题

多数严重情形是,当某些或所有不兼容NIC连接到Cisco交换机时。在这种情况下,看来交换机有性能问题。用Cisco交换机要检查NIC的兼容性,参考排除故障思科Catalyst交换机的本文对NIC兼容性问题

您需要区分在前两个案件之间(故障排除冲突域缓慢和VLAN缓慢),因为这两个原因介入不同的域。使用冲突域缓慢,问题位于交换机(或在交换机边缘,在交换机端口)或外部的外部到交换机。可能是单独分段有问题(例如,一订购过量分段,超出分段长度、物理问题在分段或者集线器/中继器问题)。一旦VLAN缓慢,问题很可能位于在交换机(或多个交换机里面)。如果不正确地诊断问题,您可以浪费寻找问题的时间在错误的地方。

因此,在您诊断了盒后,请检查如下所示的项目。

一旦共享段:

  • 确定是否超载分段或过度预定

  • 确定分段是否是健康的(包括,如果电缆长度正确,如果衰减在准则内,并且,如果有介质的物理损伤)

  • 确定网络端口和所有NIC连接对分段是否有兼容的设置

  • 确定NIC是否很好执行(和运行最新的驱动程序)

  • 确定网络端口是否继续显示增加错误

  • 确定是否超载网络端口(特别是如果它是服务器端口)

一旦一个点到点共享段或者无碰撞的(全双工)分段:

  • 确定端口和NIC兼容的配置

  • 确定分段的健康

  • 确定NIC的健康

  • 寻找网络端口错误或超额预订

排除故障慢VLAN内部(广播域)

在验证以后没有双工不匹配或按照上述部分说明的冲突域问题,您能当前排除故障VLAN内部缓慢。在隔离缓慢的位置的下一步是执行在主机之间的数据传输在同样VLAN (但是在不同的端口;即在不同的冲突域)和比较与同样测验的性能在备选VLAN。

下列可能导致慢VLAN :

1These三缓慢的VLAN内部连接的原因是超出本文的范围之外,并且可能由思科技术支持工程师要求故障排除。在排除以上所列的前五个可能的原因以后,您可能需要打开与思科技术支持的一服务请求。

流量环路

流量环路是慢VLAN的多数常见原因。与环路一起,您应该看到表明的其他症状您体验环路。对于排除故障生成树协议环路,参考本文生成树协议问题和相关设计注意事项。虽然强大的交换机(类似思科Catalyst 6500/6000)有支持千兆位背板的在NIC和接收/传输(Rx/tx)缓冲区能处理一些(STP)循环,无需减弱管理CPU的性能,循环的数据包能造成输入缓冲溢出在交换机,导致性能低下,当连接其它设备时。

如下列场景所显示,环路的另一示例是一不对称已配置的EtherChannel, :

slow_int_vlan_connect-2.gif

在本例中,端口1/1和1/2在信道,但是端口2/1和2/2不是。

Switch1有一个已配置的信道(牵强的信道),并且交换机2ï ¿  ½没有对应的端口的信道配置。如果泛洪流量(mcast/bcast/unknown单播)从Switch1流往Switch2, Switch2循环它回到信道。它不是一条完整环路,因为流量不断地没有循环,但是一次只反射。它是总环路一半的。有两这样误配置能创建一条完整环路,如下面示例所显示。

slow_int_vlan_connect-3.gif

危险等级有这样误配置是MAC地址在不正确端口了解,当流量不正确地交换,导致包丢失。考虑,例如,连接对Switch1有活动热备份路由协议(HSRP)的一个路由器(如以上图表所显示)。在路由器广播包以后,其MAC由Switch2反向循环并且了解信道由Switch1,直到单播信息包从路由器再发送。

被超载的或订购过量VLAN

公告是否有瓶颈(订购过量分段)任何地方在您的VLAN并且找出他们。第一个符号超载您的VLAN是,如果在端口的Rx或Tx缓冲区是订购过量的。如果看到outdiscards或indiscards在一些端口,请确认是否超载那些端口。(在indiscards的一增加不仅指示一全双工Rx缓冲区。)在Catalyst OS (CatOS)中,有用的命令发出是show mac mod/端口显示顶部[N]。在Cisco IOSï ¿  ½软件方面(本地),您能发出show interfaces slot-/port- counters errors命令发现丢弃。被超载的或过度预定的VLAN方案和流量环路方案经常互相随附于,但是他们能分开也存在。

当流量的聚集的带宽被低估时,频繁地,超载在骨干网端口发生。工作的最佳方法在此问题附近是配置在端口被堵塞的设备之间的一EtherChannel。如果网段已经是信道,请添加更多端口到信道组增加信道容量。

并且请注意思科快速转发(CEF)极化问题。此问题在流量由路由器负载平衡的网络发生,但是由于Cisco快速转发算法一致性,所有流量被对立,并且,在下一跳,没有负载平衡。因为要求有负载平衡L3链路的,有些拓扑,然而此问题经常不发生。关于Cisco快速转发和负载均衡的更多信息,请参阅排除故障介入在Catalyst 6500/6000系列交换机的CEF用Supervisor引擎2和运行CatOS系统软件的单播IP路由

被超载的VLAN的另一个原因是不对称路由问题。这类配置能也导致充斥您的VLAN的过高数据流量。欲知更多信息,参考原因1 :本文交换式校园网络中的单播泛洪的不对称路由部分。

有时瓶颈可以是网络设备。如果您尝试,例如,抽4千兆位流量,虽然有3千兆位背板的交换机,您最终获得流量的一大量损耗。了解网络交换机体系结构是超出本文的范围;然而,就网络交换机的产能而论,当,请注意以下方面:

  • 底板容量

  • head-of-line封闭问题

  • 阻塞和无阻塞交换机/端口体系结构

在交换机带内路径的拥塞

在交换机带内路径的拥塞能导致生成树环路或不稳定性的其他类型在网络的。所有Cisco交换机的带内端口是管理数据流的虚拟端口(流量提供接口例如Cisco发现协议和Port Aggregation Protocol [PAgP])对管理处理器。带内端口被认为虚拟,因为,在一些体系结构方面,用户看不到它,并且带内功能与正常端口操作一起。例如,在Catalyst 4000的SC0接口, Catalyst 5000和Catalyst 6500/6000系列交换机(运行CatOS)是带内端口的一子集。建立接口SC0提供管理处理器的仅一IP协议栈在配置的VLAN内,当对管理处理器的带内端口提供访问网桥协议数据单元的(BPDU)时在任何配置的VLAN和许多其他管理协议的(例如Cisco发现协议,互联网组管理协议[IGMP], Cisco组管理协议和动态中继协议[DTP])。

如果带内端口超载(由于一个不正确的配置的应用程序或用户数据流),可能导致协议stateï ¿  ½稳定性根据已接收正常的消息或“的hello”所有协议的不稳定性。此状态能导致临时环路,建立接口飘荡和其他问题,导致此种缓慢。

导致带内端口的拥塞交换机的是很难的,虽然有恶意形成的拒绝服务攻击可能成功。没有办法对速率限制或请减少在带内端口的流量。解决方案要求交换机管理员干预和调查。带内端口通常有拥塞的一个允差上限。很少执行带内端口故障或陷在Rx或Tx方向。这将含义严重硬件中断,并且影响整个交换机。此情况是很难识别和由思科技术支持工程师通常诊断。症状是交换机突然变得“聋”并且停止看到控制流量这样asï ¿  ½ Cisco发现协议邻居更新。这指示一Rx带内问题。(如果,然而,一Cisco发现协议邻居被看到,您可以确信带内工作。)相应地,如果所有连接的交换机丢失从单个交换机(以及其他管理协议的) Cisco发现协议,它指示从该交换机带内接口的Tx问题。

交换机管理处理器高CPU利用率

如果超载一个带内路径,能引起交换机体验高CPU情况;并且,作为CPU进程所有该不必要的流量,情况恶化。如果高CPU利用率是由一个被超载的带内路径或一个备选问题造成的,能影响管理协议正如在交换机带内路径部分的拥塞所描述,上述。

一般来说,请认为管理CPU所有交换机一个易受攻击点。一台配置的交换机正确地减小高CPU利用率引起的问题风险。

Catalyst 4000系列交换机的Supervisor引擎I和II的体系结构设计这样管理CPU在交换涉及在头顶上。记住以下:

  • CPU编程一交换矩阵,每当一个新的路径(Supervisor引擎I和II基于路径的)进入交换机。如果超载一个带内端口,造成其中任一新建的路径丢弃。这导致在更高层协议的数据包丢失的(静音模式丢弃)和缓慢,当流量交换在端口之间时。(参考在交换机带内路径的部分拥塞,上述。)

  • 因为CPU在Supervisor引擎I和II部分地执行交换,高CPU情况能影响Catalyst 4000的交换功能。在Supervisor引擎I的高CPU利用率和II可能由交换在头顶上本身造成。

Supervisor引擎II+、III和IV Catalyst 4500/4000系列相当流量容差, butï ¿ Â在基于Cisco IOS软件的Supervisor引擎的½ MAC地址学习仍然执行完全在软件方面(由管理CPU);有机会高CPU利用率能影响此进程和导致缓慢。如同Supervisorï ¿  ½引擎我和II,大量MAC地址学习或者重学能导致在Supervisor引擎II+, III和IV.的高CPU利用率

CPU在Catalyst 3500XL和2900XL系列交换机的MAC学习,因此导致快速地址重学的影响CPU性能的进程涉及。

并且, MAC地址学习学习的过程(即使完全在硬件方面实现)是一相对缓慢的进程,与交换过程比较。如果有重学MAC地址不断地高的速率,则必须找到和排除原因。在网络的一生成树环路能导致重学此种的MAC地址。重学拍动的MAC地址(或MAC地址)可能由实现基于端口的VLAN的第三方交换机,因此它也造成意味着MAC地址没与VLAN标记有关联。这种交换机,当连接对Cisco交换机在某些配置方面,可能导致在VLAN之间的MAC泄漏。反过来,这可能导致重学MAC地址高的速率并且可能降低性能。

在直通交换机的入口错误

直通入口错误信息包传播涉及减慢冲突域连接,但是,因为错误信息包转接对另一分段,问题看上去交换在分段之间。直通交换机(例如Catalyst 8500系列园区网交换路由器(CSR)和Catalyst 2948G-L3或者L3交换模块Catalyst 4000系列的)开始packet/frame交换,当交换机有足够的信息从读数据包的L2/L3报头转发数据包到其目的地端口或端口。因此,而数据包交换在入口和输出端口之间,数据包的开始处已经转发在输出端口外面,而数据包的其余由入站端口仍然接收。什么发生,如果入口分段不是健康的并且生成循环冗余冗余校验(CRC)错误或残帧?交换机认可此,只有当接收帧的末端时,并且,那时,大多数帧转接在输出端口外面。因为它没有意义转接不正确的帧的其余,其余丢弃,输出端口增加“underrun”错误,并且入站端口增加对应的错误计数器。如果多入站端口是不健康的,并且他们的服务器在输出端口驻留,看来服务器分段有问题,即使不是。

对于直通L3交换机,请注意underrruns,当您看到他们时,检查所有入站端口错误。

软件或硬件误配置

误配置可能造成VLAN慢。这些负面影响也许起因于是的VLAN订购过量或超载,但是经常,他们起因于差的设计或被忽略的配置。例如,分段(VLAN)可以由组播数据流容易地淹没(例如,视频或音频流),如果限制条件技术的组播数据流在该VLAN没有适当地配置。这样组播数据流可能影响数据传输,导致在整个VLAN的包丢失所有用户的(和充斥没有打算接收组播流)用户的分段。

软件Bug和硬件故障

软件Bug和硬件故障是很难识别,因为他们导致偏差,是难排除故障。如果相信问题是由软件Bug或硬件故障引起的,与思科技术支持工程师联系安排他们调查问题。

排除故障缓慢的在VLAN中间连接

在排除故障缓慢的在VLAN中间连接(在VLAN之间)前,请调查并且排除在排除故障冲突域问题讨论的问题并且排除故障本文的缓慢的VLAN内部(广播域)部分。

多数时间,缓慢的在VLAN中间连接是由用户误配置造成的。例如,如果不正确地配置MLS或组播多层交换(MMLS),然后信息包转发由路由器CPU完成,是一个慢路径。要避免误配置和当必要时高效地排除故障,您应该了解您的L3转发设备使用的机制。在大多数情况下, L3转发机制根据路由的编译和地址解析服务(ARP)表和编程的解压缩的信息包转发信息到硬件(快捷方式)。在编程的快捷方式过程中的所有失败导致软件信息包转发(一个慢路径),错误转发(转发对错误端口),或者数据流黑洞。

通常快捷方式编程失败或不完整快捷方式(可能也导致软件的信息包转发,错误转发的创建或者数据流黑洞)是软件Bug的结果。如果怀疑此是案件,请让思科技术支持工程师调查它。缓慢的在VLAN中间的转发的其他原因包括硬件故障,然而这些原因是超出本文的范围。硬件故障在硬件方面防止成功的快捷方式创建,因此,并且可能采取一个慢(软件)路径或可能黑色被钻孔的流量。应该由思科技术支持工程师处理硬件故障。

如果是肯定的设备适当地配置,但是硬件交换不发生,则软件Bug或硬件故障可能是原因。然而,请注意设备功能在形成此结论前。

当硬件转发可能停止或不发生时,下列是两个最常见的情况在:

  • 存储快捷方式的内存用尽。一旦内存全双工,软件通常停止进一步快捷方式创建。(例如, MLS, Netflow或基于Cisco Express Forwarding的,是否变得非激活,一旦没有新的快捷方式的空间,并且它换成软件[slow path]。)

  • 设备没有设计执行硬件交换,但是不是显然的。例如, Catalyst 4000系列Supervisor引擎III和以后设计对仅硬件转发IP数据流;其他流量类型是CPU处理的软件。另一示例是例如要求CPU干预访问控制表(ACL)的配置(与“日志”选项)。适用于此规则的流量由CPU在软件方面处理。

在直通switchï ¿  ½的入口错误能也造成InterVLAN路由缓慢。直通交换机使用同样结构上原理转发L3和L2流量,因此在部分提供的故障排除方法排除故障慢VLAN内部(广播域),以上,可以应用到L2流量。

影响InterVLAN路由的另外一种误配置是在最终用户设备的误配置(例如PC和打印机)。一个常见的情况是不正确的配置的PC;例如,默认网关是不正确的配置的, PC ARP表无效,或者IGMP客户端发生了故障。一个普通的案件是,当有多个路由器或支持路由的设备时,并且某些或所有最终用户PCs被不正确配置使用错误的默认网关。这可能是最麻烦的案件,和所有网络设备配置因此,并且工作正常,然而,最终用户设备不使用他们误配置。

如果在网络的一个设备是没有任一种硬件加速的一个正常路由器(和不参加Netflow MLS),则速率流量转发取决于完全CPU的速度,并且多么忙碌是。高CPU利用率明确地影响转发速率。在L3交换机上,然而,高CPU情况不一定影响转发速率;高CPU利用率影响CPU的能力创建(程序)硬件快捷方式。如果快捷方式已经安装到硬件,则,即使CPU是高利用的,流量(被编程的快捷方式)在硬件方面交换,直到快捷方式老化(如果有期限计时器)或删除由CPU。然而,如果路由器为任一种软件加速度配置(例如快速交换或Cisco快速转发交换),然后信息包转发可能受软件快捷方式的影响;如果快捷方式是残破的,或者方案失败,则而不是加速的转发速率,流量被踢对CPU,减速数据转发速率。


相关信息


Document ID: 23637