简介
奇偶校验错误是有点在内存的轻碰。 在电子和计算,从内部或外部源的电子或磁性干扰能造成一位或内存本能地翻转到相反的状态。 此事件使原始数据数据位无效和是公认的奇偶校验错误。

典型地这些错误落入两不同种类的错误,软和困难。
暂时性奇偶校验错误,这些事件瞬变和随机。 他们在一个特定的内存组中一次只通常将被看到。
永久性奇偶校验错误,造成的由内存硬件的一个物理故障或是由电路用于的读和write memory信元。 这些重复通常被看到并且要求更换。
多数奇偶校验错误是由静电或磁性相关环境状况造成的。 多数在存储器芯片的事件错误造成由:本底辐射(例如从宇宙射线,核设施的中子),电磁干扰(EMI)和静电放电。 这些事件可能随机地更改一个或更多存储单元的电子状态或可能干涉电路用于的读和write memory信元。
奇偶校验错误是生活之本当谈到高密度内存和用于ASR9k线路卡。 因此我们如何处理他们确实是我们能有控制的所有。一些ASR9k (xmen/台风),在少见情况下,线路卡可能遇到第一层缓存错误。 这些出现作为内核紧急在数据缓存或说明缓存(DCPERR或ICPERR)。 另一个被观察的错误在NP使用的多种存储段中(网络处理器)线路卡的。 这些通常是被看到的开始与错误日志的以下类型:
%PLATFORM-NP-0-NON_RECOVERABLE_SOFT_ERROR
%PLATFORM-NP-3-ECC
%PLATFORM-PFM-0-CARD_RESET_REQ
此处问题是DCPERR/ICPERR导致全双工线路卡重新加载。 同样真实对绝大多数的多种NP存储段。 因为多数线路卡有多个NP,这不明显地是理想的。 为什么影响在线路卡的所有NP,如果only1 NP有一个问题。
对于在台风LC CPU缓存看到的DCPERR和ICPERR错误,我们有避免一的解决方案需要恐慌和重新加载线路卡。 这执行与CSCux30405。 目前集成在版本5.3.3和以上。
对于NP内存这获得更大量复杂。 有巨大努力洗刷多种内存发现哪些我们能安全忽略或来以一个影响的方式恢复。 集成到5.3.3的多数人以上和那里是伞在普遍的版本的多数构件的SMUs。
注意: 这也导致我们可能发现
内核失败由于继续中断CSCvc69282的宣传品。
NP软件错误处理改进
在后半局2015和及早2016,许多改进被做了对NP台风和印第安战斧的软件错误处理。 处理许多不同的内存的从要求线路卡重新加载对事优美例如修复在内存的错误或执行NP快速重置的方法转换。 处理没有不可能清除的一功能影响的错误的,但是(“粘贴”)也改善,以便错误没有更加长将继续复发。 另外,几个Bug特别是为在NP说明内存或内部TCAM生成的错误修复。 大约80-90%以前非可恢复错误当前是可退回的,并且不要求线路卡重新加载。
所有这些改进和修正在5.3.3版本集成以上。 修正也是可用的在伞SMUs为所有主要维护版:
434 - CSCux16975
512 - CSCux44633
513 - CSCux16975
531 - CSCux34531
532 - CSCux78563