ルータ : Cisco 10000???? ??????? ???

10000 ESR PRE2 パリティ エラー フォールト ツリー

2016 年 10 月 27 日 - 機械翻訳について
その他のバージョン: PDFpdf | 英語版 (2015 年 4 月 22 日) | フィードバック


目次


概要

このドキュメントでは、さまざまなパリティ エラー メッセージを確認した場合の、トラブルシューティング手順、および Cisco 10000 シリーズ Edge Services Router(ESR)と Performance Routing Engine(PRE2)のどのコンポーネントで障害が発生しているかを特定する手順について説明します。

前提条件

要件

このドキュメントの読者は次の項目に関する知識が必要です。

使用するコンポーネント

このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づくものです。

  • PRE2 を使用している Cisco 10000 シリーズ ESR

  • Cisco IOS?? の全バージョン ソフトウェア

この文書は、Cisco 10720 シリーズ インターネット ルータには適用されません。

このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。 このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。 ネットワークが稼働中の場合は、コマンドが及ぼす潜在的な影響を十分に理解しておく必要があります。

表記法

ドキュメント表記の詳細は、『シスコ テクニカル ティップスの表記法』を参照してください。

PRE2 ルート プロセッサ パリティ エラー障害ツリー分析

Cisco 10000 シリーズ ESR PRE2 は、2 枚のサーキット カードから構成されています。 それは、ルート プロセッサ(RP)とフォワーディング プロセッサ(FP)です。 次のフローチャートで、ESR PRE2 のどのコンポーネントが、ルート プロセッサのパリティまたはエラー訂正コード(ECC)エラー メッセージの原因になっているかが判別できます。

/image/gif/paws/44228/esr10000a.gif

パリティまたは ECC エラー イベントの発生中に、show tech-support コマンド出力とコンソール ログのキャプチャと記録を行い、crashinfo と pxf_crashinfo ファイルをすべて収集します。

PRE2 パリティおよび ECC 検出

次の図は、パリティまたは ECC エラーが発生した可能性がある PRE2 RP アーキテクチャの一部を示しています。

esr10000b.gif

PRE2 RP は、共有メモリ(SDRAM)に対してシングルビット エラー(SBE)訂正およびマルチビット エラー(MBE)検出 ECC を使用します。 SDRAM の SBE は自動的に訂正され、システムは通常通り操作を続行します。

SDRAM の MBE は致命的なイベントで、キャッシュ エラー例外またはバス エラーが発生します。 システム内の残りのメモリとバスは、シングルビット パリティ検出を使用します。 上図 1 と 3 の SBE は重大で、ルータがリセットされます。

Cisco 10000 シリーズ ESR ルート プロセッサのパリティおよび ECC エラー

Cisco ESR PRE2 の読み込みまたは書き込み操作では、いくつかのパリティ チェック デバイスから誤ったパリティを持つデータについて報告がある場合があります。

PRE 2 をインストールした ESR 上で報告されたさまざまな RP エラー メッセージを、次に説明します。

例 1:

エラー メッセージの最初の行は、パリティ エラーの場所を示していて、上記の表に示されているいずれかの場所になります。 この例では、その場所は L3 データ キャッシュです。

Error: SysAD, data cache, fields: data, 1st dword
Physical addr(21:3) 0x195BE88,
Virtual address is imprecise.
    Imprecise Data Parity Error
    Imprecise Data Parity Error

2 度目の障害が発生したら、PRE2 を交換してください。

例 2:

エラー メッセージの最初の行は、パリティ エラーの場所を示していて、上記の表に示されているいずれかの場所になります。 この例では、その場所は L3 命令キャッシュです。

Error: SysAD, instr cache, fields: data, 1st dword
Physical addr(21:3) 0x000000,
virtual addr 0x6040BF60, vAddr(14:12) 0x3000
virtual address corresponds to main:text, cache word 0
 
          Low Data     High Data  Par  Low Data     High Data  Par
L1 Data:  0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01
          2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01
           Low Data     High Data  Par  Low Data     High Data  Par
DRAM Data: 0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01
           2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01

例 1 に示すように、2 度目に障害が発生した後、PRE2 を交換します。

PRE2 高速パケット ECC 障害ツリー分析

FP サーキット カードは、PRE2 アセンブリの最上部にあるボードです。 FP ボードは、特定用途向け集積回路(ASIC)を 5 基搭載しており、その構成はバックプレーン インターフェイス ASIC が 1 基、パラレル エクスプレス フォワーディング(PXF)ネットワーク処理 ASIC が 4 基です。 各 ASIC は外部メモリ システムにアクセスできます。

次の図で、Cisco 10000 シリーズ ESR PRE2 FP のどのコンポーネントが、ECC エラー メッセージの原因になっているかが判別できます。

/image/gif/paws/44228/esr10000c.gif

バックプレーン インターフェイス ASIC DDR FCRAM ECC エラー

バックプレーン インターフェイス ASIC は、2 つの異なる ECC で保護された Double Data Rate(DDR)高速サイクル RAM(FCRAM)メモリ、外部パケット メモリ(EPM)、および外部制御メモリ(ECM)にアクセスできます。

  • バックプレーン インターフェイス ASIC DDR FCRAM シングルビット ECC エラー

    SBE が検出され、訂正されたデータが表示されます。

    シングルビット EPM エラーは次のように報告されます。

      %C10KEVENTMGR-1-MINOR_FAULT: PXF DMA Single Bit PMC (EPM) Error 
      %C10KEVENTMGR-1-PMC_SBE_DEBUG: Address: 0x0FFE4608, Who: 0x02
      Error taken in: Check bits, bit number: 0, Check byte value = 0x58
      Errant Data:    0x00008F00 80350000
      Corrected Data: 0x00008F00 80350000
    

    シングルビット ECM エラーは次のように報告されます。

      %C10KEVENTMGR-1-MINOR_FAULT: PXF DMA Error - Correctable ECM Error 
      %C10KEVENTMGR-1-ECM_SBE_DEBUG: Address: 0x013FD0A8, Who: 0x01
      Error taken in:  Data bits, bit number: 32, Check byte value = 0x67
      Errant Data:    0x67CFFE58 00000000
      Corrected Data: 0x00CFFE59 00000000
    

    show pxf dma counters コマンドを実行することで、SBE がカウントされ、表示できます。 SBE の場合は、通常、処理は必要ありません。 ただし、これらのエラーのインスタンスが繰り返しまたは頻繁に発生する場合は、PRE2 の交換の原因になります。

  • バックプレーン インターフェイス ASIC DDR FCRAM マルチビット ECC エラー

    バックプレーン インターフェイス ASIC DDR FCRAM MBE が検出されると、PXF ネットワーク処理マイクロコードがリロードされ、ブートフラッシュに pxf_crashinfo ファイルも作成されます。 PXF ネットワーク処理マルチコードのリロードにより、バックプレーン インターフェイス ASIC が再初期化され、MBE を DDR FCRAM から効果的に消去します。

    バックプレーン インターフェイス ASIC DDR FCRAM の EPM マルチビット ECC エラーに対応してコンソールに出力されるメッセージ例を、次に示します。

      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Multi-bit PMC (EPM) Error 
    Downloading Microcode: file=system:pxf/c10k2-11-ucode.106.1.0.0, version=106.1.0.0,
     description=Release Software created Tue 03-Jun-03 00:57
    

    2 度目の障害が発生したら、PRE2 を交換してください。

    バックプレーン インターフェイス ASIC DDR FCRAM の ECM マルチビット ECC エラーに対応してコンソールに出力されるメッセージ例を、次に示します。

      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Error - Uncorrectable ECM Error
    Downloading Microcode: file=system:pxf/c10k2-11-ucode.106.1.0.0, version=106.1.0.0,
     description=Release Software created Tue 03-Jun-03 00:57

    2 度目の障害が発生したら、PRE2 を交換してください。

PXF ネットワーク処理 ASIC コラム メモリ ECC エラー

4 基の PXF ネットワーク処理 ASIC は、ECC で保護された DDR FCRAM コラム メモリ、または外部コラム メモリ(XCM)にアクセスしています。

  • PXF ネットワーク処理 ASIC XCM シングルビット ECC エラー

    SBE が検出され、訂正されたデータが表示されます。 show pxf xcm コマンドを実行すると、SBE がカウントされ、PXF ネットワーク処理 ASIC XCM SBE カウントを表示できます。

    SBE カウンタがラップすると、SBE が報告され、RP は PXF ネットワーク処理 ASIC によって検出された最初の SBE のアドレスを削除します。 SBE が報告される場合の報告メッセージの例を次に示します。

    %C10KEVENTMGR-1-MINOR_FAULT: T0 XCM1 FCRAM-A: Too many Toaster XCM ECC single bit errors

    上記メッセージ内の Toaster(PXF ネットワーク処理 ASIC)番号と DDR FCRAM インターフェイスは、ラップしたカウンタからの SBE が検出された XCM インターフェイスを反映しています。 上記のエラー メッセージは、Toaster 0、XCM 1、インターフェイス A 上で発生したエラーを示しています。SBE カウンター ラップについては、通常、処理は必要ありません。 ただし、これらのエラーのインスタンスが繰り返しまたは頻繁に発生する場合は、PRE2 の交換の原因になります。

  • PXF ネットワーク処理 ASIC XCM マルチビット ECC エラー

    XCM マルチビット ECC エラーは修正できません。 冗長 PRE2 を備えたシステムでは、XCM MBE によりクラッシュと PRE フェールオーバーが発生します。 単一 PRE2 を備えたシステムでは、XCM MBE が検出されると、PXF ネットワーク処理 ASIC マイクロコード リロードが強制的に実行されます。 マイクロコードのリロードにより、すべての PXF ネットワーク処理 ASIC XCM メモリが再初期化され、メモリから ECC MBE が効果的に削除されます。 ログと crashinfo または pxf_crashinfo ファイルには、次のメッセージが表示されます。

      %PXF-2-FAULT: T3 XCM1 FCRAM-D: Multi-bit ECC error on bits [0:31]
    %C10KEVENTMGR-4-PXF_CRASHINFO: Writing PXF debug information to 
     bootflash:pxf_crashinfo_20030729-153845.
      %C10KEVENTMGR-1-MAJOR_FAULT: PXF DMA Toaster Fault, Restarting PXF
    00:08:01: Downloading Microcode: file=system:pxf/c10k2-11-ucode.6.1.0.0,
     version=6.1.0.0, description=Release Software created Mon 21-Jul-03 12:17
    

    この場合、エラー メッセージは Toaster(T0、T1、T2、または T3)、適切な XCM 番号(0 または 1)、およびマルチビット ECC エラーが発生した DDR FCRAM インターフェイス(A、B、C または D)を表示します。 上記のエラー メッセージは、障害が Toaster 2、XCM 1、インターフェイス B で発生したことを示しています。

    2 度目の障害が発生したら、PRE2 を交換してください。


関連情報


Document ID: 44228