Cisco インターフェイスとモジュール : Cisco ポート アダプタ

PA-A3 での SAR のクラッシュのトラブルシューティング

2003 年 2 月 14 日 - ライター翻訳版
その他のバージョン: PDFpdf | 機械翻訳版 (2013 年 8 月 21 日) | 英語版 (2007 年 11 月 15 日) | フィードバック

目次


概要

まれな状況において、PA-A3 ATM ポート アダプタのメイン プロセッサがクラッシュし、次のような「クラッシュダンプ」の出力がコンソールに表示されることがあります。

   %ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: 
 
    %ATMPA-7-REG00: status 0xF040FF00, cause 0x00008018, epc 0xBFC002EC    
 
    %ATMPA-7-REG01: ccc 0x03E7B620, eepc 0x00000000, apu_status 0x00015010    
 
    %ATMPA-7-REG02: edma_src 0x4B050964, edma_dest 0xA0820968, edma_cntl 0x00280000    
 
    %ATMPA-7-REG03: edma_count 0x060001E0, edma_status 0x00000000, aci_cntrl 0x44400540 
 
    %ATMPA-7-CWREG00: zero 0xBABEBABE, at 0x10000000, v0 0xBFC002EC, v1 0xF040FF00 
 
    %ATMPA-7-CWREG01: a0 0xB8000804, a1 0x08000000, a2 0x00000190, a3 0x10338530    
 
    %ATMPA-7-CWREG02: t0 0x8066B590, t1 0x00015010, t2 0x4B050964, t3 0xA0820968    
 
    %ATMPA-7-CWREG03: t4 0x060001E0, t5 0x00280000, t6 0x00000000, t7 0x44400540    
 
    %ATMPA-7-CWREG04: s0 0xC0000000, s1 0x00008001, s2 0x00000000, s3 0x00000000    
 
    %ATMPA-7-CWREG05: s4 0xB8100000, s5 0x4B01EA44, s6 0x88800000, s7 0x008002F4    
 
    %ATMPA-7-CWREG06: t8 0xF557C400, t9 0xB8000000, k0 0x00000000, k1 0xAB0DE6D4    
 
    %ATMPA-7-CWREG07: gp 0x8080309C, sp 0x8080398C, fp/s8 0xCCCCCCCD, ra 0x80801440    
 
    %ATMPA-7-MISC0: 00 0x00008001, 01 0x00000000, 02 0x00000000, 03 0xB8100000    
 
    %ATMPA-7-MISC1: 04 0x4B01EA44, 05 0x88800000, 06 0x008002F4, 07 0x00000000    
 
    %ATMPA-7-MISC2: 08 0x00000000, 09 0x00000000, 10 0x00000000, 11 0x00000000    
 
    %ATMPA-7-MISC3: 12 0x00000000, 13 0x00000000, 14 0x00000000, 15 0x00000000  

この文書では、PA-A3 での segmentation and reassembly(SAR)クラッシュのトラブルシューティング方法について説明します。

PA-A3 アーキテクチャ

PA-A3 では、LSI ATMizer II というチップを使用して、SAR やその他の重要な機能を提供しています。 SAR の名称は、show controllers atm の出力で表示されます。

   router#show controller atm 3/0 
 
    Interface ATM3/0 is up 
 
    Hardware is ENHANCED ATM PA - DS3 (45Mbps)    
 
    Lane client mac address is 0030.7b1e.9054 
 
    Framer is PMC PM7345 S/UNI-PDH, SAR is LSI ATMIZER II 
 
    Firmware rev: G119, Framer rev: 1, ATMIZER II rev: 3 
 
    [snip] 
 
 

ATMizer のマイクロコード(ファームウェア)は、SAR 特有のソフトウェア命令を提供するイメージです。 Cisco 7500 プラットフォームの Versatile Interface Processor(VIP)IOS®、および 7200 プラットフォームのシステム IOS には、SAR のファームウェアが含まれています。これはリセット状態から回復したときに SAR にダウンロードされます。 ATM インターフェイスで現在ロードされ、実行されているマイクロコードのバージョンを表示するには、使用しているプラットフォームに従って次のコマンドを使用してください。

  • 7200 シリーズ : show controller atm(上の出力例を参照)

  • 7500 シリーズ : show controller vip <slot#> tech

PA-A3 では、2 つの SAR を使用して、高速な OC-3 と OC-12 のリンク向けに制御と伝送を同時に行うために必要な処理能力を提供しています。 

注: DS-3 または E-3 には 1 つの SAR で十分ですが、PA-A3-T3 では整合性を保つために 2 つの SAR を使用しています。

SAR のクラッシュダンプでは、問題が発生した SAR が示されています。

    %ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump:   
    •  SAR0 = receive
    •  SAR1 = transmit

PA-A3 は、VIP2 または VIP4 の 7200 および 7500 の 2 つのルータでサポートされています。 どちらのルータでも、ポート アダプタと「ホスト」のメモリ間でのデータ パスとして peripheral component interconnect(PCI)バスが使用されています。 ホスト メモリは VIP にあるローカルの SRAM、または 7200 の Network Processing Engine(NPE)にある SRAM です。

次の図では、VIP2 のアーキテクチャと、PCI バスの位置を示しています。

SAR では、パケット メモリへの伝送用に PCI バスへの接続を提供しています。  また ATM のセル処理や、外部配線への PHY または物理インターフェイスに関する SAR 機能もあります。

クラッシュのタイプ

SAR のクラッシュは、クラッシュの原因に基づいて、いくつかのカテゴリに分類できます。 回復不可能なエラーが見つかったときには、必ず SAR はクラッシュします。 これらのエラーは、ソフトウェアまたはハードウェアが原因の場合があります。原因を特定するには、クラッシュダンプの出力の 2 行目にある cause レジスタを調べます。cause レジスタの値の 2 ビット目から 6 ビット目に例外コードが記録されています。最も右側のビットを 0 ビット目として数えます。次に例を示します。

    %ATMPA-7-REG00: status 0xF040FF10, cause 0x00004018, epc 0x80802F68 
  1. 16 進数の値 0x00004018 を 2 進数に変換します。 それぞれの 16 進数の値は 4 ビットを表していることに注意してください。  この例では、2 進数の値は 0100 0000 0001 1000 になります。

  2. 右側から左側へ数えて、2 ビット目から 6 ビット目までの位置を確認します。この例では、2 ビット目から 6 ビット目までの値は 00110 になります。

  3. この 5 つのビットを再度 16 進数に変換します。  この例では、00110 が 0x06 になります。

  4. 例外コードの表を調べます。この例では、SAR はセカンダリ バスのエラー例外が原因でクラッシュしました。 
例外コード  説明 考えられる原因
0x00  割り込み  割り込みの状態が発生。
0x01  TLB 変更の例外
0x02  TLB 例外(ロードまたはフェッチ)
0x03 TLB 例外(ストア) 
0x04 アドレス エラー(ロードまたはフェッチ) アドレスの不整合(ソフトウェア)。
0x05 アドレス エラー(ストア)  アドレスの不整合(ソフトウェア)。
0x06  バス エラー  バスのタイムアウト、パリティ エラーなど(ハードウェア)。
0x07 予約済み 
0x08 Syscall  SYSCALL 命令を実行しようとした。
0x09  ブレークポイント  BREAK 命令を実行しようとした。
0x0a  予約済み命令  正しくない命令を実行しようとした。
0x0b  コプロセッサが使用不可  使用不可能なコプロセッサで実行しようとした。
0x0c  数値演算のオーバーフロー 
0x0d  トラップ 
0x0e 予約済み 
0x0f  浮動小数点  取り付けられていない FPU にアクセスしようとした。
0x10-1f 予約済み 

cause レジスタの値がどのようなときでも、そのビット 15 が 1 になっている場合は、SAR のクラッシュの原因がハードウェアが原因の PCI のアボートまたはパリティ エラーであることを示しています。 cause レジスタはクラッシュダンプで次のように表示されます。

cause 0x00008000  

この cause レジスタの値の問題をトラブルシューティングするには、ATM ポート アダプタを交換します。それでも問題が解決しないときは、7500 シリーズのルータを使用している場合には versatile interface processor(VIP)を交換し、7200 または 7400 シリーズのルータを使用している場合には network processing engine(NPE; ネットワーク プロセッシング エンジン)または network services engine(NSE; ネットワーク サービス エンジン)を交換します。 

既知の問題

Cisco Bug ID CSCdr09895 では、コンソールにクラッシュダンプが繰り返し表示される問題を回避しています。これは、トラブルシューティングに関連するのが、最初のクラッシュダンプだけであるためです。次に示す Bug ID は、SAR のクラッシュを引き起こすまれな状態を解決するものです。使用している IOS リリースがこれらの Bug ID と関係しているかどうかを判断するには、CCO の「Bug Toolkit」(登録ユーザのみ)を使用してください。

Cisco Bug ID

説明

CSCdp62791

設定されていない VC にある SAR、または不正なカプセル化方式を使用している SAR にパケットを送らないようにして、SAR1 クラッシュを回避します。

注: 異なる症状が報告されますが、CSCdp01166 は、CSCdp62791 に Duplicate され、CSCdp62791 を通じて解決されています。

CSCdp42529

送信 SAR には存在しない VPI/VCI のペアに関するセルを受信したことによって発生する SAR1 クラッシュを回避します。  この問題は、大量の SVC が生成されるか切断された場合に発生します。そのため送信 SAR で、VIP または NPE の ホスト CPU からのコマンド割り込みが失敗します。  この現象が発生すると、VC が受信 SAR でのみ定義され、未定義の VPI/VCI ペアで OAM ループバックまたはリソース管理セルが受信された場合に 送信 SAR がクラッシュします。

CSCdr09895

通過トラフィックが大量に発生した状態で、segmentation and reassembly(SAR)を待機しているパケットが保存されている場合、SAR がセカンダリ メモリにある不正なアドレスにアクセス使用としたときに発生する SAR0 クラッシュを回避します。 この状態は、バス エラーと呼ばれます。

CSCdp64588 繰り返し生じる SAR(0 または 1)クラッシュのために起きるルータのクラッシュを回避します。 SAR がクラッシュした場合、PCI ホストドライバ(PA-A3 とルータの PCI バスとの間のインターフェイスを提供するもの)は PA を再度開始させようとします。 SAR クラッシュが繰り返し発生し、PA がホストドライバに応答できない場合、ホストドライバは PA をシャットダウン(電源切断)しようとし、PA のスイッチが切られます。 場合によっては、SAR がクラッシュし、ホストドライバによってこの PA に関連するメモリをすでにクリアしたときに、バス エラーによってルータがクラッシュします。

トラブルシューティング

次で、PA-A3 ATM ポート アダプタでの SAR クラッシュのトラブルシューティング方法について要約します。

  • SAR0(受信 SAR)のクラッシュか、SAR1(送信 SAR)のクラッシュかを判断します。  クラッシュダンプの 1 行目で判別できます。

    %ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump 
     
     
  • 例外コードの表を使用して、クラッシュダンプの出力に示されている cause レジスタの値をデコードします。

  • cause レジスタのビット 15 の値が 1 になっている場合は、ハードウェアを交換します。

  • cause レジスタが他の値を示している場合は、Cisco TAC 用に次の情報を収集します。

    • クラッシュダンプの出力

    • show controller atm(7200 シリーズ)

    • show controller vip <slot#> tech(7500 シリーズ)

    • show tech-support

  • 現在実行している Cisco IOS(R) ソフトウェア トレインの最新のメンテナンス リリースのインストールを真剣に検討してください。

原因が判明し、既知の問題を確認したら、Cisco Technical Assistance Center でケースをオープン、より詳細なトラブルシューティングを行ってください。


関連するシスコ サポート コミュニティ ディスカッション

シスコ サポート コミュニティは、どなたでも投稿や回答ができる情報交換スペースです。


関連情報


Document ID: 10501